На GitHub появился проект reverse-skill, посвящённый автоматизации задач реверс-инжиниринга и анализа безопасности с помощью ИИ.
В проект добавляется файл
Внутри больше 20 направлений: APK-реверс, статический анализ IDA, реверс JS-фронтенда, безопасность прошивок, обход EDR, эксплуатация уязвимостей. В общем, все типичные сценарии защиты и нападения.
исходники🤩
В проект добавляется файл
routing.md, в нём расписано, по какому пути идти агенту для разных задач безопасности. Агент получает его и сам решает, какие инструменты и методы использовать.Внутри больше 20 направлений: APK-реверс, статический анализ IDA, реверс JS-фронтенда, безопасность прошивок, обход EDR, эксплуатация уязвимостей. В общем, все типичные сценарии защиты и нападения.
исходники
Please open Telegram to view this post
VIEW IN TELEGRAM
На днях вышел Mistral OCR 4
Он распознаёт документы на 170 языках.
Тестеры сравнили OCR 4 с другими решениями в лоб. Независимые аннотаторы вслепую ранжировали 600+ реальных документов на 12+ языках. OCR 4 победил каждую систему. Средний винрейт 72%.
На бенчмарках картина похожая. OlmOCRBench - 85.20. Особенно заметен разрыв на редких языках
Из интересного - OCR 4 смог превратить рукописный экзамен по математическому анализу в чистый LaTeX.
Модели дали фото страницы с рукописным экзаменом. Она прочитала почерк и восстановила каждую формулу в структурированный цифровой текст.
Результат: 5.1 секунды обработки при стоимости всего $0.09.
Формулы были распознаны корректно. График модель не перерисовала, но это как раз показательно. Большинство OCR-систем просто извлекают текст и теряют подобные элементы. OCR 4 распознал график, выделил его отдельным блоком и пометил как chart. Он не появился в виде новой отрисовки, но был учтён в структуре документа.😨
https://mistral.ai/news/ocr-4/
Он распознаёт документы на 170 языках.
Тестеры сравнили OCR 4 с другими решениями в лоб. Независимые аннотаторы вслепую ранжировали 600+ реальных документов на 12+ языках. OCR 4 победил каждую систему. Средний винрейт 72%.
На бенчмарках картина похожая. OlmOCRBench - 85.20. Особенно заметен разрыв на редких языках
Из интересного - OCR 4 смог превратить рукописный экзамен по математическому анализу в чистый LaTeX.
Модели дали фото страницы с рукописным экзаменом. Она прочитала почерк и восстановила каждую формулу в структурированный цифровой текст.
Результат: 5.1 секунды обработки при стоимости всего $0.09.
Формулы были распознаны корректно. График модель не перерисовала, но это как раз показательно. Большинство OCR-систем просто извлекают текст и теряют подобные элементы. OCR 4 распознал график, выделил его отдельным блоком и пометил как chart. Он не появился в виде новой отрисовки, но был учтён в структуре документа.
https://mistral.ai/news/ocr-4/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Figma появятся генеративные плагины, которые можно создавать вместе с агентом.
Достаточно описать в чате нужную функцию, и помощник соберет и интегрирует готовый плагин с удобным интерфейсом
Таким же образом можно генерировать шейдеры для эффектов элементов.
Также завезли Figma Motion. Похоже на LottieLab, только без прыжков между тулзами и с коллабой в реальном времени. Если дальше подтянут экспорт и перфоманс, половина таких отдельных анимационных сервисов просто перестанет иметь смысл.
🐸 🐸 🐸
Достаточно описать в чате нужную функцию, и помощник соберет и интегрирует готовый плагин с удобным интерфейсом
Таким же образом можно генерировать шейдеры для эффектов элементов.
Также завезли Figma Motion. Похоже на LottieLab, только без прыжков между тулзами и с коллабой в реальном времени. Если дальше подтянут экспорт и перфоманс, половина таких отдельных анимационных сервисов просто перестанет иметь смысл.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Вау, вот это скорость разработки! 🚀
На GitVerse появилось зеркало PyPI — теперь Python‑пакеты доступны, даже если upstream PyPI упадёт или станет недоступен.
Ставьте зеркало как основной источник или держите как резерв. Рассказали, как это сделать, здесь!
На GitVerse появилось зеркало PyPI — теперь Python‑пакеты доступны, даже если upstream PyPI упадёт или станет недоступен.
Ставьте зеркало как основной источник или держите как резерв. Рассказали, как это сделать, здесь!
Как улучшить свой /goal, спроектировав цикл до его запуска
Плохо спроектированный цикл быстро сжигает токены и выдаёт мусор. поэтому важно потратить время на проектирование loop harness
Вместо того чтобы просто написать /goal и надеяться, что он сработает, ты сначала прогоняешь его через LOOPER skill, и он:
- критикует твой цикл и приводит его к лучшим практикам из библиотеки
- собирает верификационный рубрикатор, чтобы цикл понимал, что значит «готово»
- даёт возможность подключить LLM в роли судьи, включая Codex и модели кроме Claude
- настраивает ограничения и бюджет токенов — жёсткий или свободный, чтобы процесс не разъехался
- экспортирует всё как переносимый артефакт, который можно повторять и править
- даёт визуальную диаграмму цикла
Это слой проектирования, который помогает собрать цикл, выдающий качественный результат, а потом передаёт его в Claude Code или другие модели🐸 🐸
Плохо спроектированный цикл быстро сжигает токены и выдаёт мусор. поэтому важно потратить время на проектирование loop harness
Вместо того чтобы просто написать /goal и надеяться, что он сработает, ты сначала прогоняешь его через LOOPER skill, и он:
- критикует твой цикл и приводит его к лучшим практикам из библиотеки
- собирает верификационный рубрикатор, чтобы цикл понимал, что значит «готово»
- даёт возможность подключить LLM в роли судьи, включая Codex и модели кроме Claude
- настраивает ограничения и бюджет токенов — жёсткий или свободный, чтобы процесс не разъехался
- экспортирует всё как переносимый артефакт, который можно повторять и править
- даёт визуальную диаграмму цикла
Это слой проектирования, который помогает собрать цикл, выдающий качественный результат, а потом передаёт его в Claude Code или другие модели
Please open Telegram to view this post
VIEW IN TELEGRAM
Anthropic представила Claude Tag
Claude теперь можно добавить в Slack как полноценного участника команды. Достаточно упомянуть его в сообщении, и он самостоятельно разобьет задачу на этапы, выполнит работу с помощью доступных инструментов и опубликует результат прямо в ветке обсуждения.
Claude Tag умеет писать и мержить PR-s, анализировать данные, помогать с устранением инцидентов и выполнять другие задачи. При этом в каждом канале работает один общий Claude, поэтому любой участник команды может продолжить работу с того места, где остановился коллега.
По мере общения Claude накапливает контекст канала, поэтому ему не нужно каждый раз заново объяснять детали проекта. Если включить режим
По словам Anthropic, уже 65% кода продуктовой команды создается с помощью внутренней версии Claude Tag. Верим?🐸
Сейчас функция доступна в бета-версии для пользователей Claude Enterprise и Claude Team в Slack.
P.S. Практически сразу после анонса разработчики CopilotKit представили Open Tag — открытую альтернативу Claude Tag. Проект совместим с любой ИИ-моделью, любым агентным фреймворком и кастомными агентами, поддерживает генеративный UI, потоковую генерацию ответов, Human-in-the-Loop и полный контекст ветки обсуждения.
Пока доступ выдают через форму раннего доступа, хотя авторы утверждают, что проект полностью открыт и в ближайшее время откроют больше клиентов, включая Telegram, WhatsApp и Discord.
Claude теперь можно добавить в Slack как полноценного участника команды. Достаточно упомянуть его в сообщении, и он самостоятельно разобьет задачу на этапы, выполнит работу с помощью доступных инструментов и опубликует результат прямо в ветке обсуждения.
Claude Tag умеет писать и мержить PR-s, анализировать данные, помогать с устранением инцидентов и выполнять другие задачи. При этом в каждом канале работает один общий Claude, поэтому любой участник команды может продолжить работу с того места, где остановился коллега.
По мере общения Claude накапливает контекст канала, поэтому ему не нужно каждый раз заново объяснять детали проекта. Если включить режим
ambient behavior, он начнет сам проявлять инициативу: возвращаться к затихшим обсуждениям и сообщать о важных событиях из связанных каналов и инструментов.По словам Anthropic, уже 65% кода продуктовой команды создается с помощью внутренней версии Claude Tag. Верим?
Сейчас функция доступна в бета-версии для пользователей Claude Enterprise и Claude Team в Slack.
P.S. Практически сразу после анонса разработчики CopilotKit представили Open Tag — открытую альтернативу Claude Tag. Проект совместим с любой ИИ-моделью, любым агентным фреймворком и кастомными агентами, поддерживает генеративный UI, потоковую генерацию ответов, Human-in-the-Loop и полный контекст ветки обсуждения.
Пока доступ выдают через форму раннего доступа, хотя авторы утверждают, что проект полностью открыт и в ближайшее время откроют больше клиентов, включая Telegram, WhatsApp и Discord.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Как не дать ИИ заливать мусор в GitHub.
В репозитории git push no-mistakes предложили подход, где изменения прогоняются через локальную проверку до попадания в PR.
Идея простая. Перед пушем ветка проходит валидацию: ИИ проверяет код, дальше запускаются тесты, линтер, генерация документации и CI. Всё это работает локально через worktree, без блокировок и без остановки процесса разработки.
Если всё зелёное — открывается чистый pull request.🐸
В репозитории git push no-mistakes предложили подход, где изменения прогоняются через локальную проверку до попадания в PR.
Идея простая. Перед пушем ветка проходит валидацию: ИИ проверяет код, дальше запускаются тесты, линтер, генерация документации и CI. Всё это работает локально через worktree, без блокировок и без остановки процесса разработки.
Если всё зелёное — открывается чистый pull request.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Yandex B2B Tech запустил Vibecraft – сервис для вайбкодинга создания сайтов и веб-приложений
Yandex B2B Tech на фестивале про карьеру и технологии Young Con открыл публичный доступ к Vibecraft — сервису для создания сайтов и веб-приложений по текстовому описанию. С его помощью моджно создавать прототипы цифровых продуктов, трекеров, CRM-систем, мини-игр и не только.
Что умеет:
🔴 добавлять личный кабинет, каталог и форму загрузки файлов🔴 подтягивать фирменный дизайн🔴 публиковать проекты в интернете, в том числе на своих доменах
...и многое другое
🔥На старте каждый пользователь получает 4000 нейрокредитов для тестирования. А до 1-ого июля среди всех, кто создаст первый проект разыграют iPhone 17.
Завайбкодить проект можно по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
Как создать агента, который со временем становится лучше
Есть три направления, в которых агент может обучаться:
1. Модель. Работает только для задач, где можно однозначно определить правильный и неправильный ответ, например в программировании и математике. Это лучше оставить крупным лабораториям.
2. Harness (обвязка). Это последовательность шагов, инструменты и проверки безопасности, которые вы выстраиваете вокруг модели. Этим легко управлять, и именно здесь можно быстро получить заметный результат.
3. Контекст. Это текстовое представление всего, чему агент уже научился. Вероятно, самое простое место, с которого стоит начать.
Но есть ещё одна вещь, которую многие упускают. Агент должен учиться у своих пользователей. Нужно извлекать опыт каждый раз, когда пользователь исправляет решение агента. Ничто не заменит обратную связь, полученную в реальном использовании.
p.s. Вот статья от Atai Barkai на эту тему🐸
Есть три направления, в которых агент может обучаться:
1. Модель. Работает только для задач, где можно однозначно определить правильный и неправильный ответ, например в программировании и математике. Это лучше оставить крупным лабораториям.
2. Harness (обвязка). Это последовательность шагов, инструменты и проверки безопасности, которые вы выстраиваете вокруг модели. Этим легко управлять, и именно здесь можно быстро получить заметный результат.
3. Контекст. Это текстовое представление всего, чему агент уже научился. Вероятно, самое простое место, с которого стоит начать.
Но есть ещё одна вещь, которую многие упускают. Агент должен учиться у своих пользователей. Нужно извлекать опыт каждый раз, когда пользователь исправляет решение агента. Ничто не заменит обратную связь, полученную в реальном использовании.
p.s. Вот статья от Atai Barkai на эту тему
Please open Telegram to view this post
VIEW IN TELEGRAM