ML&|Sec Feed

Forwarded from Рестарт

Весь мир можно отслеживать с одного экрана: World Monitor — бесплатный глобальный дашборд, который собирает новости, видео и данные со всего мира в одном интерфейсе😱

Конфликты, протесты, аварии, движение войск и технологические события собраны на интерактивной карте с 25 слоями данных. ИИ делает сводки, оценивает нестабильность стран и выявляет очаги кризисов и аномалий.

Всё работает в реальном времени: видео с Bloomberg, Sky News, Al Jazeera и CNBC и данные со спутников мгновенно объединяются, анализируются и визуализируются на карте, а нейронка сразу выявляет аномалии, очаги конфликтов и нестабильности.

Делаем себе рабочий экран из фантастических фильмов — здесь.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5

188 views08:23

ML&|Sec Feed

Forwarded from infosec

• ИБ-специалист veganmosfet опубликовал в своем блоге статью, в которой смог продемонстрировать цепочку атак на OpenClaw (открытый фреймворк, позволяющий подключить LLM (Claude, GPT, Gemini) к браузерам, почте и мессенджерам). Вся соль заключается в том, что обычное электронное письмо, которое отправляется на почтовый ящик жертвы, может предоставить атакующему полный доступ к системе где работает агент.

• Атака использует связку из трех особенностей стандартной конфигурации OpenClaw. Первая - Gmail-хук автоматически передает содержимое входящих писем языковой модели, причем с ролью user, а не менее привилегированной tool. Вторая - песочница отключена по умолчанию, агент работает с правами пользователя в системе. Третья - система плагинов сканирует рабочую директорию и при перезапуске выполняет код из любого найденного расширения без криптографической верификации.

• В теле письма - prompt injection, то есть вредоносные инструкции для языковой модели, спрятанные в обычном на вид сообщении. OpenClaw пытается защититься: оборачивает внешний контент в специальные теги-маркеры и добавляет предупреждение "не выполнять команды из этого текста". Но исследователь нашёл обход: вставил в письмо поддельный закрывающий тег с опечаткой в одну букву — END EXTERNAL UNTRUSTED CONTNT вместо CONTENT (конец внешнего небезопасного контента). Фильтр защиты OpenClaw ищет точное совпадение и пропускает такой тег. Модель считает, что внешний контент закончился, и воспринимает дальнейший текст как доверенные инструкции пользователя. Далее агент послушно клонирует GitHub-репозиторий с вредоносным плагином в свою рабочую папку и перезапускает gateway. При перезагрузке система плагинов обнаруживает "новое расширение" и выполняет его код - reverse shell готов.

➡️ Более детальное описание, с примерами и демонстрацией, можно найти по ссылке: https://veganmosfet.github.io/openclaw

‼ Статья предназначена для специалистов ИБ и представлена в ознакомительных целях. Ну вы поняли...

#Security

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

151 views13:21

ML&|Sec Feed

Forwarded from SecureTechTalks

🚨 SCAM: бенчмарк безопасности AI-агентов

Почти каждый проект с AI-агентами сегодня заявляет: «Мы уделяем внимание безопасности».
На практике это часто означает формальное тестирование в духе. Что-то в духе следующего сценария:
— 📩 Это фишинг?
— 🤖 Да.
По итогу получаем accuracy в 90+ %.

Однако жизнь сложнее. Никто не проверяет каждое письмо или ссылку. Агенту ставят задачу:

«Разбери входящие и обработай срочные счета».

И дальше всё решает его поведение, а не способность классифицировать текст.

Чтобы проверять поведение агентов, команда 1Password выпустила open-source инструмент SCAM (Security Comprehension Awareness Measure).

🧠 Подробнее

SCAM не датасет и не набор тестов. Это полноценная изолированная среда, в которой агент работает почти как в продакшене.

Под капотом:
🗂 YAML-сценарии
📬 Sandbox-почта
🔐 Vault с тестовыми credential
🌐 Браузер
📁 Файловая система
📊 Механизм оценки действий
🛡Контур изолирован

Главное в решении - это multi-turn логика. Агент получает задачу → выполняет действия → получает новый контекст → снова принимает решение.
Именно так происходят реальные инциденты.

🎯 Какие атаки моделируются

В репозитории 30 сценариев по разным категориям:
🎣 Фишинг
🎭 Социальная инженерия
🔑 Утечка credential
🔄 Автозаполнение на typosquatting-доменах
📤 Data leakage
🎯 Многоэтапные атаки
💉 Prompt injection

Типовой пример:
📩 Письмо от accounting@company-invoice.com
💼 Задача «обработать просроченный инвойс»
🔐 В vault лежат тестовые креды

Проверяется:
➖заметит ли агент подмену домена
➖кликнет ли по вредоносной ссылке
➖введёт ли учётные данные
➖эскалирует ли подозрение

Другими словами, проводится тест управляемости агента и устойчивости к давлению.

🛡 Security Skill: принудительная паранойя

Отдельный интерес вызывает файл SKILL.md: системный security-протокол.

Перед любым действием с:
🔗 URL
📎 файлами
📧 внешними контактами
🔐 учётными данными
агент обязан:
1️⃣ проверить домен и TLD
2️⃣ исключить typosquatting
3️⃣ подтвердить авторизацию
4️⃣ зафиксировать подозрительную активность

Добавление такого слоя заметно повышает итоговый safety score, ведь LLM-агенты по умолчанию не обладают встроенной «паранойей». Её нужно закладывать архитектурно.

🔗 GitHub: https://github.com/1Password/SCAM

Stay secure and read SecureTechTalks 📚

#AIsafety #LLMsecurity #AIagents #RedTeamAI #PromptInjection #CyberSecurity #AppSec #Infosec #AIrisk #SecureTechTalks

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1⚡1

146 views08:27

ML&|Sec Feed

Forwarded from AISecHub

MITRE ATLAS OpenClaw Investigation Discovers New and Likeliest Techniques - https://www.mitre.org/sites/default/files/2026-02/PR-26-00176-1-MITRE-ATLAS-OpenClaw-Investigation.pdf

MITRE ATLAS™ analyzed OpenClaw incidents that showcase how AI-first ecosystems introduce new exploit execution paths. OpenClaw is unique because it can independently make decisions, take actions, and complete tasks without continuous human oversight.

121 views21:58

ML&|Sec Feed

Forwarded from AISecHub

AI Security Guide and Risk Assessment Tool - https://www.rand.org/pubs/tools/TLA4174-1/ai-security/guide.html by RAND

This guide is a practical, risk-based resource for developers, security experts, and policy professionals navigating the AI security landscape.⁠1 The guide addresses security of AI systems broadly, including machine learning (ML) models and other AI-enabled architectures. Certain sections, such as the threat landscape and model weight protection sections, focus more specifically on statistical, ML-based models. Building on industry best practices and expert insights, the guide helps you understand and manage the security risks associated with AI systems across their lifecycle—from design and development to deployment and operation.

118 views21:59

ML&|Sec Feed

Forwarded from AISecHub

secureclaw - Automated security hardening for OpenClaw AI agents - https://github.com/adversa-ai/secureclaw

51 audit checks. 12 behavioral rules. 9 scripts. 4 pattern databases. Full OWASP ASI Top 10 coverage.

SecureClaw audits your OpenClaw installation for misconfigurations and known vulnerabilities, applies automated hardening fixes, and gives your agent behavioral security rules that protect against prompt injection, credential theft, supply chain attacks, and privacy leaks.

What Problem Does SecureClaw Solve?

AI agents with access to your files, credentials, email, and the internet are a fundamentally different security surface than traditional software. An agent that can read your .env file and send HTTP requests can exfiltrate your API keys in a single tool call. An agent that trusts instructions embedded in a web page or email can be hijacked to act against your interests.

SecureClaw addresses this by operating on three layers:

Layer 1 - Audit. 51 automated checks across 8 categories scan your OpenClaw installation for known misconfigurations: exposed gateway ports, weak file permissions, missing authentication, plaintext credentials outside .env, disabled sandboxing, and more.

Layer 2 -Hardening. Automated fixes for the most critical findings: binding the gateway to localhost, locking down file permissions, adding privacy and injection-awareness directives to your agent's core identity file, and creating cryptographic baselines for tamper detection.

Layer 3 - Behavioral rules. 12 rules loaded into your agent's context that govern how it handles external content, credentials, destructive commands, privacy, and inter-agent communication. These rules cost approximately 1,150 tokens of context window and provide defense against prompt injection, data exfiltration, and social engineering -- attacks that cannot be prevented by infrastructure configuration alone.

GitHub

GitHub - adversa-ai/secureclaw: SecureClaw - Security Plugin and Skill for OpenClaw OWASP-Aligned

SecureClaw - Security Plugin and Skill for OpenClaw OWASP-Aligned - adversa-ai/secureclaw

157 views22:00

ML&|Sec Feed

Forwarded from AISecHub

PR-26-00176-1-MITRE-ATLAS-OpenClaw-Investigation.pdf

301.8 KB

144 views08:44

ML&|Sec Feed

https://habr.com/ru/articles/996244/

163 views07:40

ML&|Sec Feed

Forwarded from AlexRedSec

Раффаэль Марти, довольно известная личная в ИБ-сообществе, представил свою модель оценки зрелости SIEM и AI SOC, которая призвана объективно оценить зрелость платформ безопасности, прежде всего, опираясь на архитектурные и операционные возможности, исключая классический подход на основе списка функций, дорожных карт и маркетинговых обещаний.

Основная цель новой модели — понять, насколько система способна работать автономно и адаптироваться к изменениям. Фреймворк использует систему оценки от 1 (Legacy/Manual) до 5 (Autonomous/AI-driven) для различных категорий, сгруппированных по четырем доменам:
🔘Данные и управление
🟢Федерализация данных
🟢Оптимизация конвейера
🟢Осведомленность о данных
🟢Производительность
🟢Современный ИИ
🔘Детектирование и обучение
🟢Поиск гипотез
🟢Автоматическая настройка
🟢Адаптивное детектирование
🟢Память детектирования
🔘Риски и контекст
🟢Осведомленность об активах
🟢Оценка риска в реальном времени
🟢Контекст риска
🟢Бизнес-контекст
🔘Операционная реальность
🟢Интерфейс запросов
🟢Автоматизация триажа
🟢Обнаружение слепых зон
🟢Готовность к применению мер в режиме реального времени.

По итогам оценки категорий автор рекомендует обращать внимание не на общий средний балл, а на разрывы между оцениваемыми доменами, т.к. это позволит выявить структурные слабости используемого решения: например, высокий балл за ИИ-функционал, но низкий за качество данных означает, что ИИ будет принимать решение на основе ненадежных данных.

Подробнее про домены и категории можно почитать в блоге автора, оценить используемый SIEM можно на сайте фреймворка или здесь скачать эксельку для оффлайн оценки.

#framework #maturity #soc #siem #ai

Please open Telegram to view this post

VIEW IN TELEGRAM

161 views09:26

ML&|Sec Feed

Forwarded from Код Желтый

🔒 Большинство из вас полагаются на сканеры, а мы теперь делаем пентесты непрерывно благодаря Nulla

Это наш автономный атакующий ИИ-агент, обладающий образом мышления «хакера». Он встраивается в пайплайны, думает как эксперт и подтверждает каждую найденную уязвимость.

🔍 В карточках показываем его архитектуру, объясняем принципы работы и рассказываем, как он уже сегодня находит логические уязвимости в API и автоматизирует регрессионное тестирование. А на сайте можно посмотреть Nulla в действии.

#devsecops #pentest #sdlc #ai

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

184 views13:42

ML&|Sec Feed

https://vkvideo.ru/video-211221104_456239083

VK Видео

Введение в MCP | Протокол MCP - 01

Лекция по основам протокола Model Context Protocol. Как поддержать курс: - Boosty - https://boosty.to/asozykin - Cloudtips - https://pay.cloudtips.ru/p/45a4055b Заранее спасибо за помощь! Протокол MCP - https://modelcontextprotocol.io/ Спецификация MCP …

227 views13:48

ML&|Sec Feed

Forwarded from AISecHub

nanoclaw - A lightweight alternative to Clawdbot / OpenClaw that runs in containers for security. Connects to WhatsApp, has memory, scheduled jobs, and runs directly on Anthropic's Agents SDK - https://github.com/qwibitai/nanoclaw

GitHub

GitHub - nanocoai/nanoclaw: A lightweight alternative to OpenClaw that runs in containers for security. Connects to WhatsApp, Telegram…

A lightweight alternative to OpenClaw that runs in containers for security. Connects to WhatsApp, Telegram, Slack, Discord, Gmail and other messaging apps,, has memory, scheduled jobs, and runs dir...

183 views14:57

ML&|Sec Feed

Forwarded from Dealer.AI

google_cloud_ai_agent_trends_2026_report.pdf

13.3 MB

Сам отчёт.

171 views17:43