Anthropic представила Claude Tag
Claude теперь можно добавить в Slack как полноценного участника команды. Достаточно упомянуть его в сообщении, и он самостоятельно разобьет задачу на этапы, выполнит работу с помощью доступных инструментов и опубликует результат прямо в ветке обсуждения.
Claude Tag умеет писать и мержить PR-s, анализировать данные, помогать с устранением инцидентов и выполнять другие задачи. При этом в каждом канале работает один общий Claude, поэтому любой участник команды может продолжить работу с того места, где остановился коллега.
По мере общения Claude накапливает контекст канала, поэтому ему не нужно каждый раз заново объяснять детали проекта. Если включить режим
По словам Anthropic, уже 65% кода продуктовой команды создается с помощью внутренней версии Claude Tag. Верим?🐸
Сейчас функция доступна в бета-версии для пользователей Claude Enterprise и Claude Team в Slack.
P.S. Практически сразу после анонса разработчики CopilotKit представили Open Tag — открытую альтернативу Claude Tag. Проект совместим с любой ИИ-моделью, любым агентным фреймворком и кастомными агентами, поддерживает генеративный UI, потоковую генерацию ответов, Human-in-the-Loop и полный контекст ветки обсуждения.
Пока доступ выдают через форму раннего доступа, хотя авторы утверждают, что проект полностью открыт и в ближайшее время откроют больше клиентов, включая Telegram, WhatsApp и Discord.
UPD: https://github.com/CopilotKit/OpenTag
Claude теперь можно добавить в Slack как полноценного участника команды. Достаточно упомянуть его в сообщении, и он самостоятельно разобьет задачу на этапы, выполнит работу с помощью доступных инструментов и опубликует результат прямо в ветке обсуждения.
Claude Tag умеет писать и мержить PR-s, анализировать данные, помогать с устранением инцидентов и выполнять другие задачи. При этом в каждом канале работает один общий Claude, поэтому любой участник команды может продолжить работу с того места, где остановился коллега.
По мере общения Claude накапливает контекст канала, поэтому ему не нужно каждый раз заново объяснять детали проекта. Если включить режим
ambient behavior, он начнет сам проявлять инициативу: возвращаться к затихшим обсуждениям и сообщать о важных событиях из связанных каналов и инструментов.По словам Anthropic, уже 65% кода продуктовой команды создается с помощью внутренней версии Claude Tag. Верим?
Сейчас функция доступна в бета-версии для пользователей Claude Enterprise и Claude Team в Slack.
P.S. Практически сразу после анонса разработчики CopilotKit представили Open Tag — открытую альтернативу Claude Tag. Проект совместим с любой ИИ-моделью, любым агентным фреймворком и кастомными агентами, поддерживает генеративный UI, потоковую генерацию ответов, Human-in-the-Loop и полный контекст ветки обсуждения.
Пока доступ выдают через форму раннего доступа, хотя авторы утверждают, что проект полностью открыт и в ближайшее время откроют больше клиентов, включая Telegram, WhatsApp и Discord.
UPD: https://github.com/CopilotKit/OpenTag
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Как не дать ИИ заливать мусор в GitHub.
В репозитории git push no-mistakes предложили подход, где изменения прогоняются через локальную проверку до попадания в PR.
Идея простая. Перед пушем ветка проходит валидацию: ИИ проверяет код, дальше запускаются тесты, линтер, генерация документации и CI. Всё это работает локально через worktree, без блокировок и без остановки процесса разработки.
Если всё зелёное — открывается чистый pull request.🐸
В репозитории git push no-mistakes предложили подход, где изменения прогоняются через локальную проверку до попадания в PR.
Идея простая. Перед пушем ветка проходит валидацию: ИИ проверяет код, дальше запускаются тесты, линтер, генерация документации и CI. Всё это работает локально через worktree, без блокировок и без остановки процесса разработки.
Если всё зелёное — открывается чистый pull request.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Yandex B2B Tech запустил Vibecraft – сервис для вайбкодинга создания сайтов и веб-приложений
Yandex B2B Tech на фестивале про карьеру и технологии Young Con открыл публичный доступ к Vibecraft — сервису для создания сайтов и веб-приложений по текстовому описанию. С его помощью моджно создавать прототипы цифровых продуктов, трекеров, CRM-систем, мини-игр и не только.
Что умеет:
🔴 добавлять личный кабинет, каталог и форму загрузки файлов🔴 подтягивать фирменный дизайн🔴 публиковать проекты в интернете, в том числе на своих доменах
...и многое другое
🔥На старте каждый пользователь получает 4000 нейрокредитов для тестирования. А до 1-ого июля среди всех, кто создаст первый проект разыграют iPhone 17.
Завайбкодить проект можно по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
Как создать агента, который со временем становится лучше
Есть три направления, в которых агент может обучаться:
1. Модель. Работает только для задач, где можно однозначно определить правильный и неправильный ответ, например в программировании и математике. Это лучше оставить крупным лабораториям.
2. Harness (обвязка). Это последовательность шагов, инструменты и проверки безопасности, которые вы выстраиваете вокруг модели. Этим легко управлять, и именно здесь можно быстро получить заметный результат.
3. Контекст. Это текстовое представление всего, чему агент уже научился. Вероятно, самое простое место, с которого стоит начать.
Но есть ещё одна вещь, которую многие упускают. Агент должен учиться у своих пользователей. Нужно извлекать опыт каждый раз, когда пользователь исправляет решение агента. Ничто не заменит обратную связь, полученную в реальном использовании.
p.s. Вот статья от Atai Barkai на эту тему🐸
Есть три направления, в которых агент может обучаться:
1. Модель. Работает только для задач, где можно однозначно определить правильный и неправильный ответ, например в программировании и математике. Это лучше оставить крупным лабораториям.
2. Harness (обвязка). Это последовательность шагов, инструменты и проверки безопасности, которые вы выстраиваете вокруг модели. Этим легко управлять, и именно здесь можно быстро получить заметный результат.
3. Контекст. Это текстовое представление всего, чему агент уже научился. Вероятно, самое простое место, с которого стоит начать.
Но есть ещё одна вещь, которую многие упускают. Агент должен учиться у своих пользователей. Нужно извлекать опыт каждый раз, когда пользователь исправляет решение агента. Ничто не заменит обратную связь, полученную в реальном использовании.
p.s. Вот статья от Atai Barkai на эту тему
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI представила GPT-5.6
Вместо одной модели компания выпустила целое семейство: Sol, Terra и Luna.
Sol — флагманская модель. По словам OpenAI, это самая мощная модель компании для долгосрочных задач, включая исследование и эксплуатацию уязвимостей. Она также заняла первое место в Terminal-Bench 2.1 — бенчмарке, который оценивает способность ИИ выполнять сложные задачи в терминале с планированием действий и использованием инструментов. Особое внимание в тестах уделяется сценариям из области кибербезопасности.
Для Sol появились два новых режима работы:
Последний подход напоминает OpenClaw и, возможно, отражает раннее влияние создателя OpenClaw Питера Штайнбергера после его перехода в OpenAI.
Помимо Sol компания представила ещё две модели:
Terra — производительность, близкая к GPT-5.5, при примерно вдвое меньшей стоимости.
Luna — самая доступная модель линейки, рассчитанная на высокообъёмные нагрузки.
Стоимость GPT-5.6 Sol составляет $5 за 1 млн входных токенов и $30 за 1 млн выходных токенов, что примерно соответствует ценам GPT-5.5.
Пока доступ к новым моделям ограничен. По требованию правительства США они открыты лишь для небольшой группы доверенных партнёров через Codex и API. OpenAI заявляет, что планирует открыть широкий доступ в ближайшие недели.🐸
Вместо одной модели компания выпустила целое семейство: Sol, Terra и Luna.
Sol — флагманская модель. По словам OpenAI, это самая мощная модель компании для долгосрочных задач, включая исследование и эксплуатацию уязвимостей. Она также заняла первое место в Terminal-Bench 2.1 — бенчмарке, который оценивает способность ИИ выполнять сложные задачи в терминале с планированием действий и использованием инструментов. Особое внимание в тестах уделяется сценариям из области кибербезопасности.
Для Sol появились два новых режима работы:
max — для более глубокого процесса рассуждений;ultra — с использованием саб-агентов.Последний подход напоминает OpenClaw и, возможно, отражает раннее влияние создателя OpenClaw Питера Штайнбергера после его перехода в OpenAI.
Помимо Sol компания представила ещё две модели:
Terra — производительность, близкая к GPT-5.5, при примерно вдвое меньшей стоимости.
Luna — самая доступная модель линейки, рассчитанная на высокообъёмные нагрузки.
Стоимость GPT-5.6 Sol составляет $5 за 1 млн входных токенов и $30 за 1 млн выходных токенов, что примерно соответствует ценам GPT-5.5.
Пока доступ к новым моделям ограничен. По требованию правительства США они открыты лишь для небольшой группы доверенных партнёров через Codex и API. OpenAI заявляет, что планирует открыть широкий доступ в ближайшие недели.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Нашёл бесплатный опенсорс инструмент, который за секунды превращает любые PDF, Word, Excel или отсканированные изображения в чистый Markdown:
• текст в правильном порядке
• таблицы в HTML
• формулы в LaTeX
• OCR
• 109 языков
Работает через CLI, Python или веб (mineru.net). Запускается локально на твоём компьютере. 100% приватно.
Больше 70000 звёзд на GitHub.😋
• текст в правильном порядке
• таблицы в HTML
• формулы в LaTeX
• OCR
• 109 языков
Работает через CLI, Python или веб (mineru.net). Запускается локально на твоём компьютере. 100% приватно.
Больше 70000 звёзд на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
С появлением вайбкодинга всё больше приложений выходит сразу к реальным пользователям и часто без базовой защиты и ограничений. За это прилетают счета Supabase на $200, боты, которые забивают формы в первый же день, письма с требованиями прекратить деятельность и т.п. Поэтому вот чеклист для вайбкодеров от разработчика с 20+ лет опыта. Он поможет закрыть базу перед релизом:
1. Защищайте не только приложение, но и себя. Как только вы начинаете собирать данные пользователей, вступают в силу юридические требования (GDPR, CCPA). Подготовьте политику конфиденциальности и точно знайте, где хранятся пользовательские данные.
2. Row Level Security. Без RLS любой может открыть DevTools и прочитать всю вашу БД. В Supabase это настраивается через Auth → Policies. Если политик нет, то база фактически открыта. Исправляется за несколько минут.
3. Тестируйте не только успешные сценарии. Попробуйте ввести неправильный пароль пять раз, сбросить пароль для несуществующей почты, дважды открыть ссылку подтверждения, зарегистрироваться с уже существующим email. Именно так находится большая часть ошибок аутентификации.
4. Проверьте базовую безопасность. Попросите ИИ:
5. Прогоните приложение по рекомендациям OWASP. Запрос для ИИ:
6. Валидация на клиенте. Злоумышленник может отключить JavaScript и обращаться к API напрямую. Все проверки нужно повторять на сервере.
7. Код, написанный ИИ, часто допускает утечки данных в трёх местах:
- значения из
- API возвращает больше данных, чем нужно;
- секреты оказываются в логах.
Запрос для проверки:
8. API-ключи не должны попадать во фронтенд. Если ключ оказался в браузере, считайте, что он уже скомпрометирован. Перенесите работу с ним на сервер или используйте прокси.
9. Настройте rate limiting до релиза. Ограничьте все эндпоинты, которые обращаются к платным API. Один неконтролируемый поток запросов способен увеличить счёт, например, с $20 до $200 всего за день.
10. Добавьте CAPTCHA на публичные формы. (например, бесплатный Cloudflare Turnstile) и ограничьте CORS своим доменом. Это занимает около 10 минут и эффективно защищает от массовых атак ботов.
11. Не раскрывайте внутренние ошибки пользователям. Вместо сообщений вроде:
Прогоняйте это чеклист перед каждым запуском. Вот полный разбор.🐸
1. Защищайте не только приложение, но и себя. Как только вы начинаете собирать данные пользователей, вступают в силу юридические требования (GDPR, CCPA). Подготовьте политику конфиденциальности и точно знайте, где хранятся пользовательские данные.
2. Row Level Security. Без RLS любой может открыть DevTools и прочитать всю вашу БД. В Supabase это настраивается через Auth → Policies. Если политик нет, то база фактически открыта. Исправляется за несколько минут.
3. Тестируйте не только успешные сценарии. Попробуйте ввести неправильный пароль пять раз, сбросить пароль для несуществующей почты, дважды открыть ссылку подтверждения, зарегистрироваться с уже существующим email. Именно так находится большая часть ошибок аутентификации.
4. Проверьте базовую безопасность. Попросите ИИ:
«Проверь моё приложение как специалист по безопасности и убедись, что у меня сильные заголовки безопасности и надёжный базовый уровень безопасности».5. Прогоните приложение по рекомендациям OWASP. Запрос для ИИ:
«Проверь моё приложение на соответствие стандартам OWASP и подсвети уязвимости». Так часто обнаруживаются SQL-инъекции, XSS и ошибки в системе аутентификации.6. Валидация на клиенте. Злоумышленник может отключить JavaScript и обращаться к API напрямую. Все проверки нужно повторять на сервере.
7. Код, написанный ИИ, часто допускает утечки данных в трёх местах:
- значения из
.env попадают во фронтенд;- API возвращает больше данных, чем нужно;
- секреты оказываются в логах.
Запрос для проверки:
«Проверь моё приложение на утечки credentials или чувствительных данных во фронтенде или API-роутах».8. API-ключи не должны попадать во фронтенд. Если ключ оказался в браузере, считайте, что он уже скомпрометирован. Перенесите работу с ним на сервер или используйте прокси.
9. Настройте rate limiting до релиза. Ограничьте все эндпоинты, которые обращаются к платным API. Один неконтролируемый поток запросов способен увеличить счёт, например, с $20 до $200 всего за день.
10. Добавьте CAPTCHA на публичные формы. (например, бесплатный Cloudflare Turnstile) и ограничьте CORS своим доменом. Это занимает около 10 минут и эффективно защищает от массовых атак ботов.
11. Не раскрывайте внутренние ошибки пользователям. Вместо сообщений вроде:
«SELECT * FROM users failed», показывайте нейтральные: «User not found». Подробности сохраняйте только в серверных логах.Прогоняйте это чеклист перед каждым запуском. Вот полный разбор.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследовательская группа THUDM открыла исходный код фреймворка slime для RL. Именно на нём за два дня был выполнен полный пост-тренинг модели GLM-5.2., и он же используется во всей серии GLM — от версии 4.5 до 5.1.
Ключевая идея slime - фиксированное ядро обучения. Любой RL-ран состоит из двух частей. Первая генерирует опыт: модель отвечает, система оценивает ответы. Вторая обучается на этом и обновляет веса.
Часть обучения почти не меняется. Она читает сэмплы, считает loss и делает шаг оптимизатора. Так же работает и на математике, и на агентных задачах с инструментами. Различия начинаются в генерации. В одном случае это один ответ и простая проверка результата. В другом - цикл с вызовом тулов, чтением ответов и отложенной наградой. slime фиксирует границу именно здесь. Обучающий цикл остаётся одним ядром, а всё различие уходит в то, как формируются данные.
Внутри он связывает Megatron для обучения и SGLang для rollout, а между ними стоит Data Buffer, который управляет промптами, кастомными данными и генерацией.
Обычно RL-стек разрастается в набор разрозненных тренеров, rollout-сервисов и агентных фреймворков. slime этого избегает.
Многошаговое использование инструментов, изолированные среды выполнения, обратная связь от среды и награды за проверку результата - всё это становится частью генерации данных, а не разветвлением цикла. В итоге агентные задачи и математические задачи проходят через один и тот же цикл.
Система уже обкатана на продакшене. Этот цикл используется в GLM-моделях и поддерживает Qwen3, DeepSeek V3 и Llama 3. На нём построены экосистемные проекты Dressage, Miles, vime, OpenClaw-RL и другие — без изменения ядра.
☕️ ☕️ ☕️
Ключевая идея slime - фиксированное ядро обучения. Любой RL-ран состоит из двух частей. Первая генерирует опыт: модель отвечает, система оценивает ответы. Вторая обучается на этом и обновляет веса.
Часть обучения почти не меняется. Она читает сэмплы, считает loss и делает шаг оптимизатора. Так же работает и на математике, и на агентных задачах с инструментами. Различия начинаются в генерации. В одном случае это один ответ и простая проверка результата. В другом - цикл с вызовом тулов, чтением ответов и отложенной наградой. slime фиксирует границу именно здесь. Обучающий цикл остаётся одним ядром, а всё различие уходит в то, как формируются данные.
Внутри он связывает Megatron для обучения и SGLang для rollout, а между ними стоит Data Buffer, который управляет промптами, кастомными данными и генерацией.
Обычно RL-стек разрастается в набор разрозненных тренеров, rollout-сервисов и агентных фреймворков. slime этого избегает.
Многошаговое использование инструментов, изолированные среды выполнения, обратная связь от среды и награды за проверку результата - всё это становится частью генерации данных, а не разветвлением цикла. В итоге агентные задачи и математические задачи проходят через один и тот же цикл.
Система уже обкатана на продакшене. Этот цикл используется в GLM-моделях и поддерживает Qwen3, DeepSeek V3 и Llama 3. На нём построены экосистемные проекты Dressage, Miles, vime, OpenClaw-RL и другие — без изменения ядра.
«Урок не в том, что RL нужен более крупный фреймворк. Разнообразие должно быть в генерации данных, а тренировочный цикл должен оставаться достаточно маленьким, чтобы ему можно было доверять».
Please open Telegram to view this post
VIEW IN TELEGRAM