Безопасники, это для вас: Daybreak
Daybreak объединяет самые мощные модели OpenAI, Codex и партнёров по безопасности, чтобы ускорить процессы киберзащиты и обеспечить непрерывную защиту ПО.
- Находите и устраняйте уязвимости
- Разгружайте накопившийся бэклог безопасности
- Автоматизируйте обнаружение, валидацию и реагирование на угрозы
Daybreak объединяет самые мощные модели OpenAI, Codex и партнёров по безопасности, чтобы ускорить процессы киберзащиты и обеспечить непрерывную защиту ПО.
- Находите и устраняйте уязвимости
- Разгружайте накопившийся бэклог безопасности
- Автоматизируйте обнаружение, валидацию и реагирование на угрозы
Как вам такое: Zenbu.js — фреймворк для хакерского/модифицируемого софта
Идея была в том, чтобы можно было редактировать используемые приложения прямо через код-агентов. Из этого вырос Zenbu.js
Zenbu.js позволяет собирать десктоп-приложения, которые пользователь может менять уже после установки. Это достигается за счёт:
- поставки приложения с исходным кодом
- встроенной системы плагинов для расширения логики
Приложения на Zenbu.js работают по модели, где нет жёсткого разделения между продом и разработкой. Пользователь может менять приложение так же, как разработчик во время разработки.
Установка Zenbu.js-приложения по сути означает клонирование репозитория на локальную машину и запуск в режиме разработки. Любые изменения в этом клоне сразу отражаются в запущенном приложении через горячую перезагрузку.
Есть демо и документация в репозитории.
Идея была в том, чтобы можно было редактировать используемые приложения прямо через код-агентов. Из этого вырос Zenbu.js
Zenbu.js позволяет собирать десктоп-приложения, которые пользователь может менять уже после установки. Это достигается за счёт:
- поставки приложения с исходным кодом
- встроенной системы плагинов для расширения логики
npx create-zenbu-app@latest
Приложения на Zenbu.js работают по модели, где нет жёсткого разделения между продом и разработкой. Пользователь может менять приложение так же, как разработчик во время разработки.
Установка Zenbu.js-приложения по сути означает клонирование репозитория на локальную машину и запуск в режиме разработки. Любые изменения в этом клоне сразу отражаются в запущенном приложении через горячую перезагрузку.
Есть демо и документация в репозитории.
GitHub
GitHub - zenbu-labs/zenbu.js: The framework for building hackable software
The framework for building hackable software. Contribute to zenbu-labs/zenbu.js development by creating an account on GitHub.
This media is not supported in your browser
VIEW IN TELEGRAM
Превращаем агентов в дизайн-исследователей: Lazyweb
Собирает 250 тыс. экранов рабочих приложений, чтобы искать готовые паттерны и опираться на лучшие решения при создании интерфейсов.
Легко подключается к Claude, Codex или Cursor через MCP. Можно собирать референсы и вручную.
Доступен бесплатно и без лимитов.😃
Собирает 250 тыс. экранов рабочих приложений, чтобы искать готовые паттерны и опираться на лучшие решения при создании интерфейсов.
Легко подключается к Claude, Codex или Cursor через MCP. Можно собирать референсы и вручную.
Доступен бесплатно и без лимитов.
Please open Telegram to view this post
VIEW IN TELEGRAM
В Codex добавили импорт из Claude / Claude Code – можно в один клик перенести проекты, диалоги и продолжить работу с того же места
https://chatgpt.com/codex/switch-to-codex/
https://chatgpt.com/codex/switch-to-codex/
This media is not supported in your browser
VIEW IN TELEGRAM
Новое в Claude Code: agent view – единый список всех ваших сессий
Теперь все активные агентские сессии видны на одном экране: что сейчас выполняется, что ждёт вашего ответа, а что уже завершено. На запрос агента можно ответить прямо из общего списка, без перехода в отдельную сессию.
Фича уже доступна на всех платных планах в формате research preview👍
https://claude.com/blog/agent-view-in-claude-code
Теперь все активные агентские сессии видны на одном экране: что сейчас выполняется, что ждёт вашего ответа, а что уже завершено. На запрос агента можно ответить прямо из общего списка, без перехода в отдельную сессию.
Фича уже доступна на всех платных планах в формате research preview
https://claude.com/blog/agent-view-in-claude-code
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой совет по OpenAI Codex:
Необязательно ограничиваться просмотром только одного трэда за раз.
Можно открыть сразу несколько полноценных окон параллельно и работать с несколькими задачами одновременно.
Команда
Также можно назначить хоткей для всплывающего окна Codex, чтобы быстро запускать новые задачи буквально в одно нажатие.🫡
Необязательно ограничиваться просмотром только одного трэда за раз.
Можно открыть сразу несколько полноценных окон параллельно и работать с несколькими задачами одновременно.
Команда
/side позволяет форкнуть текущий диалог в отдельную ветку для временных уточнений или дополнительных вопросов, не засоряя основной контекст.Также можно назначить хоткей для всплывающего окна Codex, чтобы быстро запускать новые задачи буквально в одно нажатие.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как заставить Claude работать, пока задача не будет доведена до конца?
Claude Code помогает с этим несколькими способами, включая одну функцию, которую недавно зарелизили:
Задаёте условие завершения — и Claude продолжает работать, пока оно не будет выполнено:
Это цикл Ralph, встроенный в Claude Code. Каждый раз, когда Claude пытается остановиться, он сверяет ваше условие с текущим логом выполнения.
Не выполнено? Продолжает работать.
Выполнено? Получаете сводку «Goal achieved».
Также есть
Отлично подходит для итеративного рефакторинга, зачистки кода или разгребания бэклога.
Ночные прогоны тестов, утренний triage, еженедельная зачистка.
Запускайте свой набор тестов, дёргайте endpoint CI, ставьте любые условия, какие вам нужны.
Долгие автономные прогоны работают только в том случае, если Claude не приходится ждать вашего участия.
Для этого есть
Документация здесь🏁
btw: в Codex тоже недавно добавили
Claude Code помогает с этим несколькими способами, включая одну функцию, которую недавно зарелизили:
/goalЗадаёте условие завершения — и Claude продолжает работать, пока оно не будет выполнено:
/goal all tests in test/auth pass and the lint step is clean
Это цикл Ralph, встроенный в Claude Code. Каждый раз, когда Claude пытается остановиться, он сверяет ваше условие с текущим логом выполнения.
Не выполнено? Продолжает работать.
Выполнено? Получаете сводку «Goal achieved».
Также есть
/loop, чтобы запускать Claude в цикле.Отлично подходит для итеративного рефакторинга, зачистки кода или разгребания бэклога.
/schedule запускает Claude по расписанию.Ночные прогоны тестов, утренний triage, еженедельная зачистка.
stop hook даёт программный контроль над тем, когда Claude разрешено завершить работу.Запускайте свой набор тестов, дёргайте endpoint CI, ставьте любые условия, какие вам нужны.
Долгие автономные прогоны работают только в том случае, если Claude не приходится ждать вашего участия.
Для этого есть
auto mode, который можно включить через Shift + Tab в CLI или через селектор режимов в десктопной версии.Документация здесь
btw: в Codex тоже недавно добавили
/goalPlease open Telegram to view this post
VIEW IN TELEGRAM
/goal - сейчас лучшая команда в Codex, Claude Code и Hermes.Но большинство используют её не так. Они пишут: «не допусти ошибок». И просто надеются.
Снизу показана структура промпта для реальной задачи: чтобы ранжировать неопределённости перед действием, убивать scope creep и закрывать все незакрытые циклы, которые обычно оставляют другие промпты.
/goal prompt [структура ниже]GOAL:
<один чёткий, измеримый результат; только одна задача>
CONTEXT:
<репозиторий / файлы / архитектура / текущее состояние>
<известные допущения, зависимости и релевантные предыдущие решения>
CONSTRAINTS:
<что нельзя изменять>
<обязательные стандарты / паттерны>
<запрещённые файлы / действия, если есть>
PRIORITY: (необязательно)
<наивысший приоритет>
<вторичный приоритет>
<третичный приоритет>
PLAN:
<сначала разобраться, потом действовать>
<перед нетривиальными изменениями пересказать своё понимание задачи>
<предпочитать минимально достаточные изменения вместо масштабных переписываний>
DONE WHEN:
<проверяемое состояние завершения>
<ожидаемое поведение сохранено или улучшено>
VERIFY:
<тесты / сборка / lint / typecheck / ручная валидация>
<указать, что не удалось проверить и почему>
<включить rollback-план или меры локализации для деструктивных либо high-risk изменений>
OUTPUT:
<краткое summary / документация / audit / результаты>
<изменённые файлы, ключевые решения, риски и дальнейшие шаги>
STOP RULES:
<останавливаться при неоднозначности или риске с высоким impact; не выдумывать архитектуру, поведение или требования>
<показывать неопределённости вместе с ранжированными вариантами с наибольшей уверенностью перед действием, а не задавать открытые уточняющие вопросы>
<не расширять scope после достижения цели>
8
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь любой может создавать RL-среды для обучения. Для этого разработали скилл -
ps. В создании RL-сред для обучения есть гораздо больше аспектов. Один из ключевых это данные, которые этот скилл напрямую не решает. Однако скилл помогает реализовывать инструменты, награды и другие компоненты RL-среды, упрощая переход от идеи к реализации и позволяя быстрее собирать решения на разных фреймворках.
Но это всё ещё очень ранняя версия работы и, скорее всего, сильно изменится.
Установка:
btw: репо открыт для вклада в проект и предложений по улучшению.😀
RL_Envs_101- Можно создавать среды в нескольких фреймворках, таких как OpenEnv, OpenReward, Verifiers, NemoGym и др
- в репозитории есть живые рабочие примеры сред, на которые может ссылаться ваш кодинг агент
- скилл изначально рассчитан на то, чтобы определить, какой тип модели вы обучаете, и уже с учётом этого создавать среду
ps. В создании RL-сред для обучения есть гораздо больше аспектов. Один из ключевых это данные, которые этот скилл напрямую не решает. Однако скилл помогает реализовывать инструменты, награды и другие компоненты RL-среды, упрощая переход от идеи к реализации и позволяя быстрее собирать решения на разных фреймворках.
Но это всё ещё очень ранняя версия работы и, скорее всего, сильно изменится.
Установка:
$ npx skills add adithya-s-k/RL_Envs_101btw: репо открыт для вклада в проект и предложений по улучшению.
Please open Telegram to view this post
VIEW IN TELEGRAM
GPT Model Hub — подключайте мощные LLM к своему проекту за пару кликов.
MWS GPT Model Hub — облачный сервис MWS Cloud для работы с LLM без развёртывания собственной ML-инфраструктуры. Внутри — модели от DeepSeek, Google, Alibaba, Zhipu AI, BAAI и Kimi K2 Instruct от Moonshot AI.
Что удобно:
• ️️️️️️️️️️Быстрая интеграция в любые сервисы и пайплайны по OpenAI-совместимому интерфейсу.
• ️️️️️️️️️Понятная детализация расходов по проектам и командам.
Можно легко тестировать разные модели, собирать пайплайны и встраивать LLM в рабочие процессы без лишней сложности.
Если давно хотели попробовать LLM или внедрить их в продукт — сейчас отличный момент.
Кстати, до 15 июля снизили цены: входящие токены — до −95%, исходящие — до −80% — особенно выгодно для сценариев с большим контекстом.
👉 Попробовать
MWS GPT Model Hub — облачный сервис MWS Cloud для работы с LLM без развёртывания собственной ML-инфраструктуры. Внутри — модели от DeepSeek, Google, Alibaba, Zhipu AI, BAAI и Kimi K2 Instruct от Moonshot AI.
Что удобно:
• ️️️️️️️️️️Быстрая интеграция в любые сервисы и пайплайны по OpenAI-совместимому интерфейсу.
• ️️️️️️️️️Понятная детализация расходов по проектам и командам.
Можно легко тестировать разные модели, собирать пайплайны и встраивать LLM в рабочие процессы без лишней сложности.
Если давно хотели попробовать LLM или внедрить их в продукт — сейчас отличный момент.
Кстати, до 15 июля снизили цены: входящие токены — до −95%, исходящие — до −80% — особенно выгодно для сценариев с большим контекстом.
👉 Попробовать
> Пока ты работаешь с языковыми моделями:
> обучаешь или дообучаешь свои модели,
> выбираешь модель под задачу,
> или пытаешься понять текущее состояние области,
почти неизбежно возникает вопрос:
как понять, что модель хорошая?
> Ответ — оценка качества. Она везде:
> лидерборды с рейтингами моделей,
> бенчмарки, которые якобы меряют рассуждения,
> знания, кодинг или математику,
> статьи с заявленными новыми лучшими результатами.
Но что такое оценка на самом деле?
И что она реально показывает?
Этот гайд от Hugging Face помогает во всём разобраться.🌟
> обучаешь или дообучаешь свои модели,
> выбираешь модель под задачу,
> или пытаешься понять текущее состояние области,
почти неизбежно возникает вопрос:
как понять, что модель хорошая?
> Ответ — оценка качества. Она везде:
> лидерборды с рейтингами моделей,
> бенчмарки, которые якобы меряют рассуждения,
> знания, кодинг или математику,
> статьи с заявленными новыми лучшими результатами.
Но что такое оценка на самом деле?
И что она реально показывает?
Этот гайд от Hugging Face помогает во всём разобраться.
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
Evaluation Guidebook - a Hugging Face Space by OpenEvals
This page automatically loads score data from several LLM leaderboards and shows an interactive chart that tracks how top benchmark results have changed. The chart groups benchmarks by category, hi...
Media is too big
VIEW IN TELEGRAM
Годнота: есть NPM-утилита, которую можно использовать в dev-режиме – она позволяет кликать прямо по UI, указать ИИ, что именно нужно изменить, а затем копировать фидбэк напрямую в ваши ИИ-инструменты для кодинга.
→ инспектит и аннотирует любой элемент
→ генерирует точный контекст компонента
→ работает с Claude Code, Cursor и другими
→ больше никаких расплывчатых промптов и скриншотов
Вместо того чтобы вручную объяснять свой UI… ИИ уже понимает, что вы имеете в виду👍
→ инспектит и аннотирует любой элемент
→ генерирует точный контекст компонента
→ работает с Claude Code, Cursor и другими
→ больше никаких расплывчатых промптов и скриншотов
Вместо того чтобы вручную объяснять свой UI… ИИ уже понимает, что вы имеете в виду
Please open Telegram to view this post
VIEW IN TELEGRAM
C 15 июня подписчики Claude получат отдельный ежемесячный API-кредит – $20, $100 или $200 в зависимости от тарифа.
Эти средства можно использовать для работы с Agent SDK, запуска Claude в интерактивном режиме через
Тем самым Антропики красиво забрали😸
https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
Эти средства можно использовать для работы с Agent SDK, запуска Claude в интерактивном режиме через
claude -p, GitHub Actions и сторонних приложений на базе Claude. При этом обычные чаты и Claude Code расходуют отдельные лимиты и не затрагивают API-балансТем самым Антропики красиво забрали
claude -p https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
Please open Telegram to view this post
VIEW IN TELEGRAM
Антропики временно увеличили еженедельные лимиты на 50%
Акция уже действует и продлится до 13 июля🤑
Акция уже действует и продлится до 13 июля
Please open Telegram to view this post
VIEW IN TELEGRAM
Как Codex 5.5 medium побеждает Codex 5.5 extra high?
Добавь это правило в
Этот промпт снижает стресс от попыток hard thinking и выхода в цикл плохих решений + помогает находить новые перспективы, которые срабатывают.
Автор идеи провёл этот эксперимент на сложных задачах (обучение моделей, запуск eval-ов, конвертация лучших чекпойнтов в GGUF и т. д.) и НЕ столкнулся ни с одной ошибкой.
Из крутого - минимальное потребление лимита: ~5 часов и недельный лимит. Можно юзать модель Codex 5.5 medium (fast), которая достаточно шустрая🏋️♂️
Но есть нюанс, план сессии должен быть спроектирован Codex 5.5 extra high! А medium-версию нужно использовать только для выполнения этого плана.
Таким образом ты не используешь размытое мышление Codex 5.5 medium, а используешь его скорость для корректного выполнения заранее составленного плана задач.
Попробуй сам.
Добавь это правило в
Agents.md:"Не борись с ошибками! Каждый раз, когда ты сталкиваешься с одной и той же ошибкой дважды, изучи веб и найди 3–5 возможных способов её исправления. Затем выбери самое эффективное решение и реализуй его."
Этот промпт снижает стресс от попыток hard thinking и выхода в цикл плохих решений + помогает находить новые перспективы, которые срабатывают.
Автор идеи провёл этот эксперимент на сложных задачах (обучение моделей, запуск eval-ов, конвертация лучших чекпойнтов в GGUF и т. д.) и НЕ столкнулся ни с одной ошибкой.
Из крутого - минимальное потребление лимита: ~5 часов и недельный лимит. Можно юзать модель Codex 5.5 medium (fast), которая достаточно шустрая
Но есть нюанс, план сессии должен быть спроектирован Codex 5.5 extra high! А medium-версию нужно использовать только для выполнения этого плана.
Таким образом ты не используешь размытое мышление Codex 5.5 medium, а используешь его скорость для корректного выполнения заранее составленного плана задач.
Попробуй сам.
Please open Telegram to view this post
VIEW IN TELEGRAM