ML&|Sec Feed
1.02K subscribers
1.07K photos
63 videos
271 files
1.65K links
Feed for @borismlsec channel

author: @ivolake
Download Telegram
Forwarded from Хабр / ML & AI
Agentic SOC в 2026: как ИИ-агенты меняют центр мониторинга безопасности и где им нельзя доверять

Agentic SOC — это не «ещё один модный модуль с ИИ», а переход от ручной обработки инцидентов и цепочек автоматизации к более самостоятельной модели, где агенты собирают контекст, обогащают инциденты, предлагают действия и иногда запускают безопасные реакции под контролем человека.

Проблема в том, что вместе с ускорением появляются новые риски: слишком широкие полномочия, ошибки сопоставления, внедрение вредоносных подсказок, неверные решения по изоляции и ложная уверенность в «умной автоматизации». Читать далее

#soc #information_security #ai_security #security_operation_center | @habr_ai
Forwarded from Dealer.AI
Дай человеку MCP для заказа и он перевернёт мир покупок.

Сегодня уже виден тренд на AI native трансформацию бизнеса: найм, обучение, инфра и adoption инструментов. Но кругом, мы видим, пока, AI inspired отдельных людей, чем компаний. Т.е. эффективнее стали единицы, а не общность. Но всеравно приятно, как эти энтузиасты осваивают наши решения и идут дальше. Вот пример, как MCP от ВкусВилл стал отправной точкой для создания такого решения заказов в Додо.

А почитать про наше решение, можно тут. Ещё примеры агентиков/ботиков с нашим MCP тут и тут. Хабр тут.

Присоединяйтесь и Вы. 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from PWN AI (Artyom Semenov)
databricks-security-framework_0.pdf
2.9 MB
Forwarded from GitHub Community
Paper2All — превратите вашу работу в веб продукт

Интегрирует другие рабочие пакеты на протяжении всего процесса "paper2present".

Сайты научных проектов могут более эффективно распространять информацию об исследованиях, если на них четко представлен основной контент, а навигация и взаимодействие интуитивно понятны.

Однако существующие подходы, такие как прямая генерация, использование шаблонов или прямое преобразование в HTML, не позволяют создавать интерактивные сайты с продуманной версткой, а комплексного набора инструментов для решения этой задачи не существует.


PAPER2WEB — это автономный конвейер, который преобразует научные статьи в интерактивные академические веб-страницы. Агент итеративно дорабатывает контент и макет, чтобы создавать увлекательные интерактивные веб-сайты, оживляющие научные статьи.

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from GitHub Community
MLE-agent — ваш интеллектуальный помощник в разработке и исследованиях в области искусственного интеллекта.

Интеграция с arxiv и статьями с кодом для улучшения планов по разработке и исследованиям.

Поддерживаются OpenAI, Anthropic, Gemini, Ollama и другие.

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
В последнее время у меня много выступлений на тему ИИ (удивительно, да). В четверг выступал на форуме DATA + AI 2026 с рассказом о безопасности ИИ-агентов. Выделено было всего 20 минут, так что успел только пройтись по верхам. Но зато хоть вышел за рамки привычных рассказов о безопасности чатботов LLM.

#ии #стратегия #презентация #мероприятие
Архитектура Безопасных AI-Агентов

Приветик, мои дорогие коллеги и самые талантливые друзья!

Весьма интересное и хорошо структурированное руководство по безопасной архитектуре ИИ-агентов, полностью доступное онлайн и бесплатно. Рекомендую к изучению (хотя бы сделайте беглый обзор). Подобный работ я еще не встречал, тем более тема горячая (да все только и делают, что говорят про ИИ-агентов))), поэтому важно находить крупицы времени и продолжать изучение этого направления.

Ссылка: https://agent-axiom.github.io/agent-arch/

Архитектор MLSecOps и AI Governance
Николай Павлов
🔥1
ИИ-агент под охраной.

Итак, относительно недавняя новость: исследователи предложили концепцию, в которой агентного ИИ-работника, умеющего что-то делать с последствиями в реальном мире, для безопасности стоит заключить в виртуальную камеру-песочницу.

И поставить на периметре ИИ-охранника, чтобы бил первого по рукам, когда тот попытается натворить что-то не то, в соответствии с политикой безопасности.

Инструкции для неё, то есть “конституцию безопасности”, можно писать на обычном языке, в данном случае английском.

Не специалист по соответствующим технологиям, по существу могут прокомментировать “настоящие сварщики”, например, Влад. Не могу сказать, взлетит ли, может и разумно звучит, время покажет.

Может быть, кривая развития так называемого ИИ приведёт к разнообразному разделению труда внутри наших устройств. Будет полная коробочка сущностей, первая пишет код, вторая созванивается, третья детали на складе заказывает, а четвёртая первых трёх стережёт, чтобы чего не удумали.

Ну а может быть, будет монолитный, шибко умный ИИ — и швец, и жнец, и на дуде игрец.

Тема немного рифмуется, например, с ломанием копий вокруг архитектуры ОС. Ну и мы тоже поучаствовали, и конечно же, для построения конструктивно безопасных ИТ-систем нужна полная изоляция компонентов!

Хочу напомнить, что, конечно, и “охранник”, и “агент-работник”, и прочие “сущности” – это не настоящие персонажи, не носители интеллекта, а алгоритмы, да, тяжёлые, сложные, требующие огромных вычислительных мощностей, просто непредставимых лет 30 назад.

Это не личности, а средства автоматизации самых разных задач, которые раньше не получалось автоматизировать, а теперь — получается. Участвовать в этой технологической волне, конечно, очень интересно.
Forwarded from Киберболоид
«Авито» заплатит за уязвимости в ИИ-сервисах

Компания расширила действие программы Bug Bounty и повысила максимальную выплату за критические проблемы безопасности до 1 млн рублей. Независимые исследователи теперь смогут тестировать ИИ-решения платформы, включая будущих ассистентов «Ави» и «Ави Pro». В программу включили и новые продукты компании — HR Messenger, HRMOST, «Автохаб» и Haraba.

➡️Подробнее читайте на портале «Киберболоид».

#киберболоид #новости
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
DARPA запускает программу роевого ИИ

DARPA выпустило приглашение на «День для потенциальных подрядчиков» перед планируемым запуском программы MATHBAC — «Математика усиления агентной коммуникации».

Суть программы — создать для нужд обороны новое поколение платформ агентного искусственного интеллекта: систем из множества ИИ-агентов, которые самостоятельно общаются между собой, распределяют задачи и совместно находят решения.

MATHBAC — это попытка научить рои ИИ-агентов думать, общаться и принимать решения быстрее любого человека, используя математику, теорию информации и теорию систем.

Один из ключевых пунктов программы — ИИ-агенты должны не просто решать задачи, но и понимать принципы собственного функционирования. Американцы хотят создать ИИ, который сам себя «чинит» и «переучивает» в полевых условиях.

DARPA ищет компактные, быстрые и специализированные ИИ-системы, а не громоздкие языковые модели вроде ChatGPT. Такие системы можно разместить на боевом корабле, самолёте или спутнике — они будут работать без подключения к облаку.

🔒DARPA&CIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AISecure
Зарелизилось еще одна прикольная серта по AI Sec

Будем посмотреть, детали потом постараюсь накинуть

А пока просто ссылка https://academy.hackthebox.com/preview/certifications/htb-certified-offensive-ai-expert

И не забываем что есть такой AI Sec Certs Landscape.

PS еще бы время на это дело найти)
🔥3
Почему модели тяготеют к правде?

Модель, это по факту большой компрессор, который в сохраняет информацию в своих весах при обучении. А какие данные хорошо компрессятся? Правильно, согласованные данные. Эзотерика, теории заговора и тупо ошибки плохо согласуются с общей картиной мира, поэтому, даже когда в обучающем датасете полно мусора (вплоть до 90%), модель все равно выучивает правду

Подробнее об этом написал мой коллега, Костя Крестников, в своем исследовании

П.С. Важный вывод, который делает Костя — "Координированная дезинформация для компрессора неотличима от правды"
Hyundai смогли запустить конвейерное производство гуманоидных роботов Boston Dynamics.

Это создает потенциал для развития этой индустрии, и появлению в 2030-2035 нового бума - массового распространения роботов.
Соответственно, для кибербезопасности ИИ - новый объект защиты, вызов, задачи и конечно решения.
Какими будут гардрейлы для роботов?.. Как предотвратить бунт роботов на dark factory?
Я в предвкушении)

https://www.youtube.com/watch?v=Bo0PcuqjNhE
Forwarded from GitHub Community
MedgeClaw — помощник на основе искусственного интеллекта с открытым исходным кодом для исследований в области биомедицины.

Создан на основе Claude Code и обладает 140 научными навыками K-Dense, панелью мониторинга в реальном времени и интеграцией с RStudio/JupyterLab.

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from GitHub Community
ClawRouter — это интеллектуальный маршрутизатор больших языковых моделей с открытым исходным кодом, который снижает затраты на использование API ИИ на 92 %.

Он анализирует каждый запрос по 15 параметрам и менее чем за 1 мс перенаправляет его на самую дешёвую из доступных моделей, причём делает это локально.

ClawRouter — единственный маршрутизатор больших языковых моделей, созданный для автономных ИИ-агентов.

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from Data Secrets
В Китае завирусился проект Colleague Skill – система для оцифровки живого сотрудника в ИИ-агента

https://github.com/titanwings/colleague-skill

Некто сделал опенсорсный проект под флагом “Distill your colleague into an AI Skill”, и за пару дней он набрал почти 9к звезд. По сути, проект позволяет собрать цифрового двойника сотрудника.

Просто загружаешь рабочие чаты, письма, результаты работы и прочее, и это превращается в базу знаний и упакованные скиллы для агентов с инструкциями о том, как человек работает и решает задачи, чем и как при этом пользуется, как общается и тд.

С одной стороны удобно, можно же сделать цифровую копию самого себя ☕️

Но в китайских медиа типа RedNote пишут, что проект начали массово использовать коллеги против коллег. Люди буквально обучают агентов для выполнения задач других сотрудников, готовясь к моменту, когда руководство решит кого-нибудь уволить и надеясь, что так они защитят от увольнения самих себя.

На этом фоне уже даже начали появляться всякие Anti-distillation tools, которые портят ваши логи и документацию так, чтобы агент не смог на них "обучиться".

Вот так.
Please open Telegram to view this post
VIEW IN TELEGRAM
Интересная модель описывается BitDefender. Называется vibeware, то есть использование LLM для написания вредоносного кода. Но особенность в том, что злоумышленники добавляют специальный компонент, который транслирует код на C++ или C# в редкие, нишевые языки программирования, например, Crystal, Zig, Nim, что позволяет обходить средства обнаружения, "заточенные" под более распространенные языки программирования. В исследовании и другие интересные примеры индустриализации ИИ при написании вредоносов описаны – стоит ознакомиться... 🤔

#malware #ии #ttp
Please open Telegram to view this post
VIEW IN TELEGRAM
1