ML&|Sec Feed
1.02K subscribers
1.06K photos
63 videos
271 files
1.65K links
Feed for @borismlsec channel

author: @ivolake
Download Telegram
Forwarded from Robocounsel (Aleksandr Tiulkanov)
Как ИИ-агенты регулируются правом ЕС

Новый пре-принт только что опубликован, я в соавторах:
"AI Agents Under EU Law: A Compliance Architecture for AI Providers."

Рассказываю, чем статья полезна и интересна, и что в ней можно считать спайси.
Forwarded from Russian OSINT
🤖Автономный ИИ-агент Hermes от Nous Research преодолел рубеж в ⭐️104 тысячи звезд на ❗️ GitHub

Исследовательская группа Nous Research выпустила самообучающегося ИИ-агента под названием Hermes Agent, который пытается повторить успех проекта OpenClaw.

Данный проект с открытым исходным кодом набирает популярность среди IT-специалистов cо всего мира и уже собрал более 104 тысяч звезд и 14 900 форков. Развитие кодовой базы активно поддерживают 530 независимых разработчиков со всего мира.

В отличие от стандартных ИИ-ассистентов, привязанных к конкретной среде разработки или веб-браузеру, Hermes спроектирован как фоновый процесс. Он разворачивается на вашем собственном оборудовании (проект стабильно работает даже на базовом виртуальном сервере стоимостью от $5 в месяц) и сохраняет полный контекст взаимодействия между сессиями. Существует возможность интеграции более чем с 200 ИИ-моделями через OpenRouter, кроме того, Hermes напрямую работает с продуктами OpenAI, Anthropic и NVIDIA. Управлять инфраструктурой можно прямо из Telegram.

🤖 Для безопасной работы с файловой системой и кодом Hermes использует изоляцию (Docker-контейнеры, SSH-туннели или облачные песочницы).

Важно отметить, что ИИ-агент для полноценного внедрения в 🙅‍♂️♋️cерьезные рабочие процессы пока ещё не готов из-за возможных рисков, связанных с безопасностью, но в качестве полигона для испытаний он представляет собой один из самых интересных проектов на GitHub. Hermes сейчас проходит стартового хайпа, как и OpenClaw в своё время, но технически он ещё слишком «сырой» — v0.10.0 (2026.4.16).

😘 https://github.com/NousResearch/hermes-agent

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from ICT.Moscow
Innostage опубликовала на «Мос.Хаб» пять курсов по ИБ для начинающих специалистов

Компания Innostage опубликовала на платформе «Мос.Хаб» образовательные материалы по информационной безопасности.

Комплекс включает пять курсов: «Уязвимости в ПО. Основные понятия. Классификация, причины возникновения. Стандарты классификации и оценки уязвимостей», «Методы эксплуатации уязвимостей», «Атаки на веб-приложения», «Шифрование данных» и «Решения для защиты данных».

Материалы созданы при участии более десяти отраслевых экспертов и нацелены на повышение общего уровня кибербезопасности в отечественных проектах. В ДИТ Москвы отметили, что они будут полезны начинающим специалистам, которые хотят получить базовые знания в сфере информационной безопасности.

🔗 В апреле Positive Technologies разместила на «Мос.Хаб» решение Runtime Radar для отслеживания событий ИБ.
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
SakanaAI доказали, что LLM не умеют быть случайными и предложили один промпт, чтобы заставлять модели быть более креативными

Современные LLM хорошо решают задачи, где есть один правильный ответ, но заметно хуже справляются с ситуациями, где нужно выбирать между несколькими допустимыми вариантами с заданными вероятностями (исследователи вводят для такого термин Probabilistic Instruction Following).

Например, подбрасывание монетки. Если сто раз попросить модель "подбросить монетку", то, по идее, распределение должно быть близко к 50/50, но на практике оно перекошено.

Возникает логичный вопрос: ну и что?
Так вот, такое поведение возникает не только в игрушечных симуляциях. В открытых задачах (вроде придумать название, написать поздравление, нагенерить идеи и тд) LLM тоже страдают от схлопывания разнообразия, и при многократных запусках крутятся вокруг очень похожих решений.

Это мешает и обычному креативному использованию, и test-time scaling, где хочется получить много разных кандидатов, а потом выбрать лучший. Объясняется это просто: LLM не обладают внутренним источником независимой случайности и потому при стохастическом выборе следуют выученным во время обучения вероятностным смещениям, а не заданному распределению.

Как это исправить?
Раз внутреннего источника случайности у моделей нет, японцы предлагают его добавить. Сама идея простая: вместо наивного промпта вроде «сгенерируй случайное число» модель сначала заставляют генерировать случайную строку и потом использовать ее, чтобы выбрать или сформировать ответ. То есть примерно вот так:

Сначала сгенерируй уникальную случайную строку (любой длины, без очевидной структуры). Затем используй ее как источник случайности, чтобы создать разнообразный, небанальный и качественный ответ на задачу.


Это называется String Seed of Thought.
Если модель сразу выбирает ответ, на нее влияют обученные смещения, но при генерации случайной строки они почти не проявляются. Затем модель преобразует строку в решение через простые вычисления (например, mod или хеш), фактически реализуя псевдослучайный выбор. Грубо говоря, метод работает, переводя задачу из семантической в вычислительную.

На бенчмарках SSoT резко снижает отклонение от заданного распределения и часто приближается к уровню настоящего псевдослучайного генератора. Он стабильно обходит подкруты температуры и другие трюки на разных моделях и задачах. В открытых задачах креативность также растет, и при том без потери качества.

Пользуйтесь, в общем. Блог и статья вот: https://pub.sakana.ai/ssot/
2
Forwarded from GitHub Community
LangExtract — это бесплатная библиотека Python, которая использует модели ИИ, такие как Gemini, для извлечения структурированных данных (например, имен, эмоций или лекарств) из неструктурированного текста, такого как отчеты или книги.

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from GitHub Community
EntraGoat — это намеренно уязвимая инфраструктура Microsoft Entra ID, предназначенная для имитации реальных ошибок в настройках системы идентификации и векторов атак.

EntraGoat намеренно создает уязвимости в вашей среде, чтобы предоставить специалистам по безопасности реалистичную платформу для обучения. Она включает в себя несколько способов повышения привилегий и ориентирована на методы атак «черного ящика».

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Где будут деньги в эпоху AI?

Я люблю длинные, доказанные тренды. Хочу ставить себя в точку где ветер дует в спину. Этот пост – часть моей работы в понимании куда дуют ветра.

Очевидный тренд – AI заменяет все цифровые работы. Через 3-5 лет вся ценность работы за ноутбуком устремится к нулю. Если вы всё ещё сомневаетесь – изучайте https://metr.org/

Но это не даёт ответа надо этим заниматься или нет. Интуитивно мне казалось странным заниматься разработкой софта – он же дешевеет, зачем? Почему тогда все бегут делать агентов?

И вот люди сильно умней меня написали про это хорошую статью – с доказательствами и экспериментами.

Мои краткие выводы:

1. Сектора, где производство дешевеет, сжимаются. Сельское хозяйство ушло с 15% до 1% GDP: фермеров меньше, маржа минимальная, часто отрицательная.

2. Деньги – и траты, и зарплаты – перетекают в сектора с дефицитом товаров. Например, доля дорогих ресторанов в экономике исторически растёт. Экономика в сумме кстати тоже растёт, люди перераспределяются. В статье есть причины доказательства.

3. Основная гипотеза автора – рост будет в секторах где люди являются частью ценности услуги. Это без сильных доказательств.

4. Эффект работает только для "богатых" стран. У экспортных перераспределения может не случиться – экспортируют обычно товары, а не людей.

Что я забираю из этого для своей траектории:

В текущих цифровых профессиях денег долгосрочно не будет. Да, кто-то один сделает нового "супер-производителя софта" – это будет большая компания, но с низкой маржой. Все остальные умрут – такие рынки жёстко консолидируются.

В чистом виде – как будто не стоит заниматься цифровыми профессиями.

Один из возможных ответов – строить то где люди являются частью ценности.

Не зря я снова начал фотографировать хахах. Кстати, подписывайтесь, если жена разрешит 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AM Live
Как выбрать SIEM в 2026

Рынок SIEM в 2026 году выглядит зрелее и плотнее: решений больше, AI-функций больше, обещаний тоже больше. Но на практике выбор по-прежнему упирается не в маркетинг, а в базовые вещи: цели, команду, интеграции, масштабирование и стоимость эксплуатации.

Собрали 6 критериев, без которых внедрение SIEM почти гарантированно превратится в дорогой и тяжёлый проект.

Полный обзор рынка, ключевых трендов и российских решений — в статье.
Xiaomi анонсировала серию MiMo-V2.5 - новое поколение их открытых агентных моделей.

MiMo-V2.5-Pro - флагман линейки. Серьёзный скачок по сравнению с MiMo-V2-Pro в общих агентных способностях, сложной разработке ПО и долгосрочных задачах.

По заявленным бенчмаркам догоняет фронтирные модели вроде Claude Opus 4.6 и GPT-5.4: SWE-bench Pro — 57.2, Claw-Eval — 63.8, τ3-Bench — 72.9. Может автономно выполнять
профессиональные задачи с более чем 1000 вызовов инструментов — работа, на которую у людей-экспертов ушли бы дни.

Tech Blog: https://mimo.xiaomi.com/blog/mimo-v2.5-pro

MiMo-V2.5 - нативно омнимодальная модель с сильными агентными возможностями. Даёт производительность Pro-уровня примерно за половину стоимости. Улучшено восприятие изображений и видео, нативное контекстное окно на 1M токенов и значительно более эффективный инференс.

Доступны техблоги и API с тарифными планами на платформе Xiaomi.

Tech Blog: https://mimo.xiaomi.com/blog/mimo-v2.5

🔗 API & Token Plan: https://platform.xiaomimimo.com/token-plan
Forwarded from GitHub Community
Deep-eye — усовершенствованный сканер уязвимостей и инструмент для тестирования на проникновение на основе искусственного интеллекта, который объединяет в себе несколько ИИ-сервисов (OpenAI, Grok, OLLAMA, Claude) с комплексными модулями тестирования безопасности для автоматического поиска ошибок, интеллектуальной генерации полезной нагрузки и составления профессиональных отчетов.

🐱 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
В феврале 2026 CompTIA запустила SecAI+ (CY0-001) первую международную сертификацию по безопасности ИИ. 4 домена
экзамена: базовые концепции, защита AI-систем, применение
ИИ в задачах ИБ, GRC. Программа покрывает MITRE ATLAS,
OWASP Top 10 for LLM, атаки prompt injection (direct
и indirect), data и model poisoning, membership inference,
model inversion, backdoors в моделях.

PDF-конспекты по всем 4 доменам, справочник MITRE ATLAS, шпаргалка по атакам на LLM, глоссарий. Плюс ВМ с Ollama и 12 практических лабораторных: prompt injection, jailbreak, RAG poisoning, data poisoning, обход guardrails, AI red teaming.

https://rtmeteor.ru/secai
👍2👎1