Как создать агента, который со временем становится лучше
Есть три направления, в которых агент может обучаться:
1. Модель. Работает только для задач, где можно однозначно определить правильный и неправильный ответ, например в программировании и математике. Это лучше оставить крупным лабораториям.
2. Harness (обвязка). Это последовательность шагов, инструменты и проверки безопасности, которые вы выстраиваете вокруг модели. Этим легко управлять, и именно здесь можно быстро получить заметный результат.
3. Контекст. Это текстовое представление всего, чему агент уже научился. Вероятно, самое простое место, с которого стоит начать.
Но есть ещё одна вещь, которую многие упускают. Агент должен учиться у своих пользователей. Нужно извлекать опыт каждый раз, когда пользователь исправляет решение агента. Ничто не заменит обратную связь, полученную в реальном использовании.
p.s. Вот статья от Atai Barkai на эту тему🐸
Есть три направления, в которых агент может обучаться:
1. Модель. Работает только для задач, где можно однозначно определить правильный и неправильный ответ, например в программировании и математике. Это лучше оставить крупным лабораториям.
2. Harness (обвязка). Это последовательность шагов, инструменты и проверки безопасности, которые вы выстраиваете вокруг модели. Этим легко управлять, и именно здесь можно быстро получить заметный результат.
3. Контекст. Это текстовое представление всего, чему агент уже научился. Вероятно, самое простое место, с которого стоит начать.
Но есть ещё одна вещь, которую многие упускают. Агент должен учиться у своих пользователей. Нужно извлекать опыт каждый раз, когда пользователь исправляет решение агента. Ничто не заменит обратную связь, полученную в реальном использовании.
p.s. Вот статья от Atai Barkai на эту тему
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI представила GPT-5.6
Вместо одной модели компания выпустила целое семейство: Sol, Terra и Luna.
Sol — флагманская модель. По словам OpenAI, это самая мощная модель компании для долгосрочных задач, включая исследование и эксплуатацию уязвимостей. Она также заняла первое место в Terminal-Bench 2.1 — бенчмарке, который оценивает способность ИИ выполнять сложные задачи в терминале с планированием действий и использованием инструментов. Особое внимание в тестах уделяется сценариям из области кибербезопасности.
Для Sol появились два новых режима работы:
Последний подход напоминает OpenClaw и, возможно, отражает раннее влияние создателя OpenClaw Питера Штайнбергера после его перехода в OpenAI.
Помимо Sol компания представила ещё две модели:
Terra — производительность, близкая к GPT-5.5, при примерно вдвое меньшей стоимости.
Luna — самая доступная модель линейки, рассчитанная на высокообъёмные нагрузки.
Стоимость GPT-5.6 Sol составляет $5 за 1 млн входных токенов и $30 за 1 млн выходных токенов, что примерно соответствует ценам GPT-5.5.
Пока доступ к новым моделям ограничен. По требованию правительства США они открыты лишь для небольшой группы доверенных партнёров через Codex и API. OpenAI заявляет, что планирует открыть широкий доступ в ближайшие недели.🐸
Вместо одной модели компания выпустила целое семейство: Sol, Terra и Luna.
Sol — флагманская модель. По словам OpenAI, это самая мощная модель компании для долгосрочных задач, включая исследование и эксплуатацию уязвимостей. Она также заняла первое место в Terminal-Bench 2.1 — бенчмарке, который оценивает способность ИИ выполнять сложные задачи в терминале с планированием действий и использованием инструментов. Особое внимание в тестах уделяется сценариям из области кибербезопасности.
Для Sol появились два новых режима работы:
max — для более глубокого процесса рассуждений;ultra — с использованием саб-агентов.Последний подход напоминает OpenClaw и, возможно, отражает раннее влияние создателя OpenClaw Питера Штайнбергера после его перехода в OpenAI.
Помимо Sol компания представила ещё две модели:
Terra — производительность, близкая к GPT-5.5, при примерно вдвое меньшей стоимости.
Luna — самая доступная модель линейки, рассчитанная на высокообъёмные нагрузки.
Стоимость GPT-5.6 Sol составляет $5 за 1 млн входных токенов и $30 за 1 млн выходных токенов, что примерно соответствует ценам GPT-5.5.
Пока доступ к новым моделям ограничен. По требованию правительства США они открыты лишь для небольшой группы доверенных партнёров через Codex и API. OpenAI заявляет, что планирует открыть широкий доступ в ближайшие недели.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Нашёл бесплатный опенсорс инструмент, который за секунды превращает любые PDF, Word, Excel или отсканированные изображения в чистый Markdown:
• текст в правильном порядке
• таблицы в HTML
• формулы в LaTeX
• OCR
• 109 языков
Работает через CLI, Python или веб (mineru.net). Запускается локально на твоём компьютере. 100% приватно.
Больше 70000 звёзд на GitHub.😋
• текст в правильном порядке
• таблицы в HTML
• формулы в LaTeX
• OCR
• 109 языков
Работает через CLI, Python или веб (mineru.net). Запускается локально на твоём компьютере. 100% приватно.
Больше 70000 звёзд на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
С появлением вайбкодинга всё больше приложений выходит сразу к реальным пользователям и часто без базовой защиты и ограничений. За это прилетают счета Supabase на $200, боты, которые забивают формы в первый же день, письма с требованиями прекратить деятельность и т.п. Поэтому вот чеклист для вайбкодеров от разработчика с 20+ лет опыта. Он поможет закрыть базу перед релизом:
1. Защищайте не только приложение, но и себя. Как только вы начинаете собирать данные пользователей, вступают в силу юридические требования (GDPR, CCPA). Подготовьте политику конфиденциальности и точно знайте, где хранятся пользовательские данные.
2. Row Level Security. Без RLS любой может открыть DevTools и прочитать всю вашу БД. В Supabase это настраивается через Auth → Policies. Если политик нет, то база фактически открыта. Исправляется за несколько минут.
3. Тестируйте не только успешные сценарии. Попробуйте ввести неправильный пароль пять раз, сбросить пароль для несуществующей почты, дважды открыть ссылку подтверждения, зарегистрироваться с уже существующим email. Именно так находится большая часть ошибок аутентификации.
4. Проверьте базовую безопасность. Попросите ИИ:
5. Прогоните приложение по рекомендациям OWASP. Запрос для ИИ:
6. Валидация на клиенте. Злоумышленник может отключить JavaScript и обращаться к API напрямую. Все проверки нужно повторять на сервере.
7. Код, написанный ИИ, часто допускает утечки данных в трёх местах:
- значения из
- API возвращает больше данных, чем нужно;
- секреты оказываются в логах.
Запрос для проверки:
8. API-ключи не должны попадать во фронтенд. Если ключ оказался в браузере, считайте, что он уже скомпрометирован. Перенесите работу с ним на сервер или используйте прокси.
9. Настройте rate limiting до релиза. Ограничьте все эндпоинты, которые обращаются к платным API. Один неконтролируемый поток запросов способен увеличить счёт, например, с $20 до $200 всего за день.
10. Добавьте CAPTCHA на публичные формы. (например, бесплатный Cloudflare Turnstile) и ограничьте CORS своим доменом. Это занимает около 10 минут и эффективно защищает от массовых атак ботов.
11. Не раскрывайте внутренние ошибки пользователям. Вместо сообщений вроде:
Прогоняйте это чеклист перед каждым запуском. Вот полный разбор.🐸
1. Защищайте не только приложение, но и себя. Как только вы начинаете собирать данные пользователей, вступают в силу юридические требования (GDPR, CCPA). Подготовьте политику конфиденциальности и точно знайте, где хранятся пользовательские данные.
2. Row Level Security. Без RLS любой может открыть DevTools и прочитать всю вашу БД. В Supabase это настраивается через Auth → Policies. Если политик нет, то база фактически открыта. Исправляется за несколько минут.
3. Тестируйте не только успешные сценарии. Попробуйте ввести неправильный пароль пять раз, сбросить пароль для несуществующей почты, дважды открыть ссылку подтверждения, зарегистрироваться с уже существующим email. Именно так находится большая часть ошибок аутентификации.
4. Проверьте базовую безопасность. Попросите ИИ:
«Проверь моё приложение как специалист по безопасности и убедись, что у меня сильные заголовки безопасности и надёжный базовый уровень безопасности».5. Прогоните приложение по рекомендациям OWASP. Запрос для ИИ:
«Проверь моё приложение на соответствие стандартам OWASP и подсвети уязвимости». Так часто обнаруживаются SQL-инъекции, XSS и ошибки в системе аутентификации.6. Валидация на клиенте. Злоумышленник может отключить JavaScript и обращаться к API напрямую. Все проверки нужно повторять на сервере.
7. Код, написанный ИИ, часто допускает утечки данных в трёх местах:
- значения из
.env попадают во фронтенд;- API возвращает больше данных, чем нужно;
- секреты оказываются в логах.
Запрос для проверки:
«Проверь моё приложение на утечки credentials или чувствительных данных во фронтенде или API-роутах».8. API-ключи не должны попадать во фронтенд. Если ключ оказался в браузере, считайте, что он уже скомпрометирован. Перенесите работу с ним на сервер или используйте прокси.
9. Настройте rate limiting до релиза. Ограничьте все эндпоинты, которые обращаются к платным API. Один неконтролируемый поток запросов способен увеличить счёт, например, с $20 до $200 всего за день.
10. Добавьте CAPTCHA на публичные формы. (например, бесплатный Cloudflare Turnstile) и ограничьте CORS своим доменом. Это занимает около 10 минут и эффективно защищает от массовых атак ботов.
11. Не раскрывайте внутренние ошибки пользователям. Вместо сообщений вроде:
«SELECT * FROM users failed», показывайте нейтральные: «User not found». Подробности сохраняйте только в серверных логах.Прогоняйте это чеклист перед каждым запуском. Вот полный разбор.
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Исследовательская группа THUDM открыла исходный код фреймворка slime для RL. Именно на нём за два дня был выполнен полный пост-тренинг модели GLM-5.2., и он же используется во всей серии GLM — от версии 4.5 до 5.1.
Ключевая идея slime - фиксированное ядро обучения. Любой RL-ран состоит из двух частей. Первая генерирует опыт: модель отвечает, система оценивает ответы. Вторая обучается на этом и обновляет веса.
Часть обучения почти не меняется. Она читает сэмплы, считает loss и делает шаг оптимизатора. Так же работает и на математике, и на агентных задачах с инструментами. Различия начинаются в генерации. В одном случае это один ответ и простая проверка результата. В другом - цикл с вызовом тулов, чтением ответов и отложенной наградой. slime фиксирует границу именно здесь. Обучающий цикл остаётся одним ядром, а всё различие уходит в то, как формируются данные.
Внутри он связывает Megatron для обучения и SGLang для rollout, а между ними стоит Data Buffer, который управляет промптами, кастомными данными и генерацией.
Обычно RL-стек разрастается в набор разрозненных тренеров, rollout-сервисов и агентных фреймворков. slime этого избегает.
Многошаговое использование инструментов, изолированные среды выполнения, обратная связь от среды и награды за проверку результата - всё это становится частью генерации данных, а не разветвлением цикла. В итоге агентные задачи и математические задачи проходят через один и тот же цикл.
Система уже обкатана на продакшене. Этот цикл используется в GLM-моделях и поддерживает Qwen3, DeepSeek V3 и Llama 3. На нём построены экосистемные проекты Dressage, Miles, vime, OpenClaw-RL и другие — без изменения ядра.
☕️ ☕️ ☕️
Ключевая идея slime - фиксированное ядро обучения. Любой RL-ран состоит из двух частей. Первая генерирует опыт: модель отвечает, система оценивает ответы. Вторая обучается на этом и обновляет веса.
Часть обучения почти не меняется. Она читает сэмплы, считает loss и делает шаг оптимизатора. Так же работает и на математике, и на агентных задачах с инструментами. Различия начинаются в генерации. В одном случае это один ответ и простая проверка результата. В другом - цикл с вызовом тулов, чтением ответов и отложенной наградой. slime фиксирует границу именно здесь. Обучающий цикл остаётся одним ядром, а всё различие уходит в то, как формируются данные.
Внутри он связывает Megatron для обучения и SGLang для rollout, а между ними стоит Data Buffer, который управляет промптами, кастомными данными и генерацией.
Обычно RL-стек разрастается в набор разрозненных тренеров, rollout-сервисов и агентных фреймворков. slime этого избегает.
Многошаговое использование инструментов, изолированные среды выполнения, обратная связь от среды и награды за проверку результата - всё это становится частью генерации данных, а не разветвлением цикла. В итоге агентные задачи и математические задачи проходят через один и тот же цикл.
Система уже обкатана на продакшене. Этот цикл используется в GLM-моделях и поддерживает Qwen3, DeepSeek V3 и Llama 3. На нём построены экосистемные проекты Dressage, Miles, vime, OpenClaw-RL и другие — без изменения ядра.
«Урок не в том, что RL нужен более крупный фреймворк. Разнообразие должно быть в генерации данных, а тренировочный цикл должен оставаться достаточно маленьким, чтобы ему можно было доверять».
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA открыла исходный код модели визуальной локализации LocateAnything-3B.
Модель умеет находить объекты даже в очень плотных сценах. Например, на изображении с десятками миньонов, стоящих вплотную друг к другу, она корректно выделяет каждого отдельной рамкой.
Главное отличие от большинства существующих моделей - это способ генерации ограничивающих рамок. Обычно координаты (
В LocateAnything-3B используется параллельное декодирование, тоесть модель сразу предсказывает готовые рамки целиком, а не строит их поэтапно. За счёт этого детекция становится стабильнее, особенно в сценах с большим количеством объектов.
Для обучения использовались не только классические датасеты для распознавания объектов, но и данные для распознавания интерфейсов, OCR и анализа структуры документов. Поэтому модель умеет находить как реальные объекты, так и элементы пользовательского интерфейса и текстовые области.
Модель содержит 3 млрд параметров и распространяется с открытым исходным кодом.💜
Модель умеет находить объекты даже в очень плотных сценах. Например, на изображении с десятками миньонов, стоящих вплотную друг к другу, она корректно выделяет каждого отдельной рамкой.
Главное отличие от большинства существующих моделей - это способ генерации ограничивающих рамок. Обычно координаты (
x1, y1, x2, y2) предсказываются последовательно, цифра за цифрой. Это замедляет работу, а ошибки на ранних этапах могут влиять на последующие координаты, особенно если объектов много.В LocateAnything-3B используется параллельное декодирование, тоесть модель сразу предсказывает готовые рамки целиком, а не строит их поэтапно. За счёт этого детекция становится стабильнее, особенно в сценах с большим количеством объектов.
Для обучения использовались не только классические датасеты для распознавания объектов, но и данные для распознавания интерфейсов, OCR и анализа структуры документов. Поэтому модель умеет находить как реальные объекты, так и элементы пользовательского интерфейса и текстовые области.
Модель содержит 3 млрд параметров и распространяется с открытым исходным кодом.
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSeek представила DSpark — новый метод спекулятивного декодирования для DeepSeek V4 Flash и DeepSeek V4 Pro, который увеличивает пропускную способность инференса на 51–400%.
По данным разработчиков, DSpark хорошо работает не только с моделями DeepSeek, но и с другими открытыми LLM, включая Gemma и Qwen.
Вместе с анонсом компания открыла исходный код проекта, опубликовала научную статью с описанием метода и выложила готовую модель на Hugging Face.
По данным разработчиков, DSpark хорошо работает не только с моделями DeepSeek, но и с другими открытыми LLM, включая Gemma и Qwen.
Вместе с анонсом компания открыла исходный код проекта, опубликовала научную статью с описанием метода и выложила готовую модель на Hugging Face.
This media is not supported in your browser
VIEW IN TELEGRAM
Проект OpenHuman менее чем за месяц набрал более 33 тысяч звёзд на GitHub. Одной из главных причин такого роста стала новая функция Super Context 🐸
При открытии нового чата OpenHuman сначала собирает контекст: анализирует релевантную информацию о пользователе, текущем экране и выполняемой работе. Благодаря этому уже первый ответ строится так, будто диалог длится уже несколько сообщений.
OpenHuman это ИИ-ассистент с открытым исходным кодом, который работает на уровне операционной системы и интегрируется со 118 приложениями. По словам разработчиков, он использует локальные данные пользователя и со временем всё лучше адаптируется к его стилю работы
Проект работает локально, поэтому данные не покидают устройство пользователя.
В течение десяти дней подряд OpenHuman входил в число самых популярных репозиториев GitHub, а сейчас занимает первое место в рейтинге платформы.
http://github.com/tinyhumansai/OpenHuman
При открытии нового чата OpenHuman сначала собирает контекст: анализирует релевантную информацию о пользователе, текущем экране и выполняемой работе. Благодаря этому уже первый ответ строится так, будто диалог длится уже несколько сообщений.
OpenHuman это ИИ-ассистент с открытым исходным кодом, который работает на уровне операционной системы и интегрируется со 118 приложениями. По словам разработчиков, он использует локальные данные пользователя и со временем всё лучше адаптируется к его стилю работы
Проект работает локально, поэтому данные не покидают устройство пользователя.
В течение десяти дней подряд OpenHuman входил в число самых популярных репозиториев GitHub, а сейчас занимает первое место в рейтинге платформы.
http://github.com/tinyhumansai/OpenHuman
Please open Telegram to view this post
VIEW IN TELEGRAM
3
This media is not supported in your browser
VIEW IN TELEGRAM
Разработчик, гений и филантроп, представил экспериментальный проект LoginWithChatGPT.
Он позволяет пользователям входить в сторонние сайты через свой аккаунт ChatGPT и использовать его возможности без необходимости оплачивать API OpenAI владельцу сервиса.
Все по-разному восприняли идею. Некоторые вспомнили, что несколько месяцев назад обсуждалась возможность использовать подписку ChatGPT как источник токенов для сторонних приложений. Другие усомнились, соответствует ли такой подход условиям использования OpenAI.
По словам автора, OpenAI уже позволяет сторонним приложениям (например OpenClaw/Hermes) получать доступ к Codex через CLI. Он с помощью реверс-инжиниринга реализовал аналогичный механизм через OAuth для веба и мобильных приложений. При этом разраб отметил, что пока не уверен, соответствует ли решение правилам OpenAI, и ждёт официального ответа компании, прежде чем открывать исходный код проекта.
Демо проекта🤔
Он позволяет пользователям входить в сторонние сайты через свой аккаунт ChatGPT и использовать его возможности без необходимости оплачивать API OpenAI владельцу сервиса.
Все по-разному восприняли идею. Некоторые вспомнили, что несколько месяцев назад обсуждалась возможность использовать подписку ChatGPT как источник токенов для сторонних приложений. Другие усомнились, соответствует ли такой подход условиям использования OpenAI.
По словам автора, OpenAI уже позволяет сторонним приложениям (например OpenClaw/Hermes) получать доступ к Codex через CLI. Он с помощью реверс-инжиниринга реализовал аналогичный механизм через OAuth для веба и мобильных приложений. При этом разраб отметил, что пока не уверен, соответствует ли решение правилам OpenAI, и ждёт официального ответа компании, прежде чем открывать исходный код проекта.
Демо проекта
Please open Telegram to view this post
VIEW IN TELEGRAM
Если используете LLM-as-a-Judge для оценки моделей, стоит обратить внимание на эту работу.
В статье представлен метод BINEVAL, который разбивает каждый критерий оценки на набор простых вопросов с ответами «да» или «нет». Каждый вопрос оценивается независимо, после чего результаты объединяются в многомерную итоговую оценку.
Такой подход позволяет увидеть, почему модель получила низкий балл по конкретному критерию, а сами ответы можно использовать для точечной доработки промптов.
Авторы сообщают, что на бенчмарках SummEval, Topical-Chat и QAGS метод без дополнительного обучения показывает результаты на уровне или выше UniEval и G-Eval, особенно при проверке фактической достоверности.
Статья: https://arxiv.org/abs/2606.27226🐸
В статье представлен метод BINEVAL, который разбивает каждый критерий оценки на набор простых вопросов с ответами «да» или «нет». Каждый вопрос оценивается независимо, после чего результаты объединяются в многомерную итоговую оценку.
Такой подход позволяет увидеть, почему модель получила низкий балл по конкретному критерию, а сами ответы можно использовать для точечной доработки промптов.
Авторы сообщают, что на бенчмарках SummEval, Topical-Chat и QAGS метод без дополнительного обучения показывает результаты на уровне или выше UniEval и G-Eval, особенно при проверке фактической достоверности.
Статья: https://arxiv.org/abs/2606.27226
Please open Telegram to view this post
VIEW IN TELEGRAM