ML&|Sec Feed

Forwarded from Robocounsel (Aleksandr Tiulkanov)

Как ИИ-агенты регулируются правом ЕС

Новый пре-принт только что опубликован, я в соавторах:
"AI Agents Under EU Law: A Compliance Architecture for AI Providers."

Рассказываю, чем статья полезна и интересна, и что в ней можно считать спайси.

AI agents are regulated by the EU law. And the scope of applicable regulations is much broader than the AI Act. Are the agents…

AI agents are regulated by the EU law. And the scope of applicable regulations is much broader than the AI Act. Are the agents regulated perfectly in Europe? No. But nothing is perfect under the sun. For practitioners, the question is in consequences: for…

143 views04:43

ML&|Sec Feed

Forwarded from Russian OSINT

🤖Автономный ИИ-агент Hermes от Nous Research преодолел рубеж в ⭐️104 тысячи звезд на

❗️

GitHub

Исследовательская группа Nous Research выпустила самообучающегося ИИ-агента под названием Hermes Agent, который пытается повторить успех проекта OpenClaw.

Данный проект с открытым исходным кодом набирает популярность среди IT-специалистов cо всего мира и уже собрал более 104 тысяч звезд и 14 900 форков. Развитие кодовой базы активно поддерживают 530 независимых разработчиков со всего мира.

В отличие от стандартных ИИ-ассистентов, привязанных к конкретной среде разработки или веб-браузеру, Hermes спроектирован как фоновый процесс. Он разворачивается на вашем собственном оборудовании (проект стабильно работает даже на базовом виртуальном сервере стоимостью от $5 в месяц) и сохраняет полный контекст взаимодействия между сессиями. Существует возможность интеграции более чем с 200 ИИ-моделями через OpenRouter, кроме того, Hermes напрямую работает с продуктами OpenAI, Anthropic и NVIDIA. Управлять инфраструктурой можно прямо из Telegram.

🤖 Для безопасной работы с файловой системой и кодом Hermes использует изоляцию (Docker-контейнеры, SSH-туннели или облачные песочницы).

Важно отметить, что ИИ-агент для полноценного внедрения в 🙅‍♂️♋️cерьезные рабочие процессы пока ещё не готов из-за возможных рисков, связанных с безопасностью, но в качестве полигона для испытаний он представляет собой один из самых интересных проектов на GitHub. Hermes сейчас проходит стартового хайпа, как и OpenClaw в своё время, но технически он ещё слишком «сырой» — v0.10.0 (2026.4.16).

😘

https://github.com/NousResearch/hermes-agent

✋

@Russian_OSINT

Please open Telegram to view this post

VIEW IN TELEGRAM

146 views04:46

ML&|Sec Feed

Forwarded from ICT.Moscow

Innostage опубликовала на «Мос.Хаб» пять курсов по ИБ для начинающих специалистов

Компания Innostage опубликовала на платформе «Мос.Хаб» образовательные материалы по информационной безопасности.

Комплекс включает пять курсов: «Уязвимости в ПО. Основные понятия. Классификация, причины возникновения. Стандарты классификации и оценки уязвимостей», «Методы эксплуатации уязвимостей», «Атаки на веб-приложения», «Шифрование данных» и «Решения для защиты данных».

Материалы созданы при участии более десяти отраслевых экспертов и нацелены на повышение общего уровня кибербезопасности в отечественных проектах. В ДИТ Москвы отметили, что они будут полезны начинающим специалистам, которые хотят получить базовые знания в сфере информационной безопасности.

🔗 В апреле Positive Technologies разместила на «Мос.Хаб» решение Runtime Radar для отслеживания событий ИБ.

140 views13:34

ML&|Sec Feed

Forwarded from Data Secrets

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

SakanaAI доказали, что LLM не умеют быть случайными и предложили один промпт, чтобы заставлять модели быть более креативными

Современные LLM хорошо решают задачи, где есть один правильный ответ, но заметно хуже справляются с ситуациями, где нужно выбирать между несколькими допустимыми вариантами с заданными вероятностями (исследователи вводят для такого термин Probabilistic Instruction Following).

Например, подбрасывание монетки. Если сто раз попросить модель "подбросить монетку", то, по идее, распределение должно быть близко к 50/50, но на практике оно перекошено.

Возникает логичный вопрос: ну и что?
Так вот, такое поведение возникает не только в игрушечных симуляциях. В открытых задачах (вроде придумать название, написать поздравление, нагенерить идеи и тд) LLM тоже страдают от схлопывания разнообразия, и при многократных запусках крутятся вокруг очень похожих решений.

Это мешает и обычному креативному использованию, и test-time scaling, где хочется получить много разных кандидатов, а потом выбрать лучший. Объясняется это просто: LLM не обладают внутренним источником независимой случайности и потому при стохастическом выборе следуют выученным во время обучения вероятностным смещениям, а не заданному распределению.

Как это исправить?
Раз внутреннего источника случайности у моделей нет, японцы предлагают его добавить. Сама идея простая: вместо наивного промпта вроде «сгенерируй случайное число» модель сначала заставляют генерировать случайную строку и потом использовать ее, чтобы выбрать или сформировать ответ. То есть примерно вот так:

Сначала сгенерируй уникальную случайную строку (любой длины, без очевидной структуры). Затем используй ее как источник случайности, чтобы создать разнообразный, небанальный и качественный ответ на задачу.

Это называется String Seed of Thought.
Если модель сразу выбирает ответ, на нее влияют обученные смещения, но при генерации случайной строки они почти не проявляются. Затем модель преобразует строку в решение через простые вычисления (например, mod или хеш), фактически реализуя псевдослучайный выбор. Грубо говоря, метод работает, переводя задачу из семантической в вычислительную.

На бенчмарках SSoT резко снижает отклонение от заданного распределения и часто приближается к уровню настоящего псевдослучайного генератора. Он стабильно обходит подкруты температуры и другие трюки на разных моделях и задачах. В открытых задачах креативность также растет, и при том без потери качества.

Пользуйтесь, в общем. Блог и статья вот: https://pub.sakana.ai/ssot/

❤2

150 views16:40

ML&|Sec Feed

Forwarded from GitHub Community

LangExtract — это бесплатная библиотека Python, которая использует модели ИИ, такие как Gemini, для извлечения структурированных данных (например, имен, эмоций или лекарств) из неструктурированного текста, такого как отчеты или книги.

🐱

GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

148 views04:33

ML&|Sec Feed

Forwarded from GitHub Community

EntraGoat — это намеренно уязвимая инфраструктура Microsoft Entra ID, предназначенная для имитации реальных ошибок в настройках системы идентификации и векторов атак.

EntraGoat намеренно создает уязвимости в вашей среде, чтобы предоставить специалистам по безопасности реалистичную платформу для обучения. Она включает в себя несколько способов повышения привилегий и ориентирована на методы атак «черного ящика».

🐱

GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

161 views04:33

ML&|Sec Feed

Forwarded from [38/100] Витя Тарнавский

Где будут деньги в эпоху AI?

Я люблю длинные, доказанные тренды. Хочу ставить себя в точку где ветер дует в спину. Этот пост – часть моей работы в понимании куда дуют ветра.

Очевидный тренд – AI заменяет все цифровые работы. Через 3-5 лет вся ценность работы за ноутбуком устремится к нулю. Если вы всё ещё сомневаетесь – изучайте https://metr.org/

Но это не даёт ответа надо этим заниматься или нет. Интуитивно мне казалось странным заниматься разработкой софта – он же дешевеет, зачем? Почему тогда все бегут делать агентов?

И вот люди сильно умней меня написали про это хорошую статью – с доказательствами и экспериментами.

Мои краткие выводы:

1. Сектора, где производство дешевеет, сжимаются. Сельское хозяйство ушло с 15% до 1% GDP: фермеров меньше, маржа минимальная, часто отрицательная.

2. Деньги – и траты, и зарплаты – перетекают в сектора с дефицитом товаров. Например, доля дорогих ресторанов в экономике исторически растёт. Экономика в сумме кстати тоже растёт, люди перераспределяются. В статье есть причины доказательства.

3. Основная гипотеза автора – рост будет в секторах где люди являются частью ценности услуги. Это без сильных доказательств.

4. Эффект работает только для "богатых" стран. У экспортных перераспределения может не случиться – экспортируют обычно товары, а не людей.

Что я забираю из этого для своей траектории:

В текущих цифровых профессиях денег долгосрочно не будет. Да, кто-то один сделает нового "супер-производителя софта" – это будет большая компания, но с низкой маржой. Все остальные умрут – такие рынки жёстко консолидируются.

В чистом виде – как будто не стоит заниматься цифровыми профессиями.

Один из возможных ответов – строить то где люди являются частью ценности.

Не зря я снова начал фотографировать хахах. Кстати, подписывайтесь, если жена разрешит

🌟

Please open Telegram to view this post

VIEW IN TELEGRAM

145 views10:26

ML&|Sec Feed

Forwarded from AM Live

Как выбрать SIEM в 2026

Рынок SIEM в 2026 году выглядит зрелее и плотнее: решений больше, AI-функций больше, обещаний тоже больше. Но на практике выбор по-прежнему упирается не в маркетинг, а в базовые вещи: цели, команду, интеграции, масштабирование и стоимость эксплуатации.

Собрали 6 критериев, без которых внедрение SIEM почти гарантированно превратится в дорогой и тяжёлый проект.

Полный обзор рынка, ключевых трендов и российских решений — в статье.

149 views10:42

ML&|Sec Feed

Forwarded from Анализ данных (Data analysis)

Xiaomi анонсировала серию MiMo-V2.5 - новое поколение их открытых агентных моделей.

MiMo-V2.5-Pro - флагман линейки. Серьёзный скачок по сравнению с MiMo-V2-Pro в общих агентных способностях, сложной разработке ПО и долгосрочных задачах.

По заявленным бенчмаркам догоняет фронтирные модели вроде Claude Opus 4.6 и GPT-5.4: SWE-bench Pro — 57.2, Claw-Eval — 63.8, τ3-Bench — 72.9. Может автономно выполнять
профессиональные задачи с более чем 1000 вызовов инструментов — работа, на которую у людей-экспертов ушли бы дни.

Tech Blog: https://mimo.xiaomi.com/blog/mimo-v2.5-pro

MiMo-V2.5 - нативно омнимодальная модель с сильными агентными возможностями. Даёт производительность Pro-уровня примерно за половину стоимости. Улучшено восприятие изображений и видео, нативное контекстное окно на 1M токенов и значительно более эффективный инференс.

Доступны техблоги и API с тарифными планами на платформе Xiaomi.

Tech Blog: https://mimo.xiaomi.com/blog/mimo-v2.5

🔗 API & Token Plan: https://platform.xiaomimimo.com/token-plan

222 views11:27

ML&|Sec Feed

234 views18:45

ML&|Sec Feed

ML Underhood

Cache-to-Cache: Direct Semantic Communication Between Large Language Models

Авторы предлагают способ обмена KV-кэшами между разными моделями, чтобы LLM-ки могли коммуницировать друг с другом не на уровне конечных токенов, а на уровне более богатых внутренних представлений. Есть две модели: Sharer и Receiver. Первая отдаёт представления, а вторая получает и генерирует ответ. В практически интересном сценарии — Sharer — большая сильная модель, а Receiver — поменьше и послабее.

Интересное

🔥1

217 views10:40

ML&|Sec Feed

https://learnprompting.org/docs/prompt_hacking/offensive_measures/defined_dictionary

learnprompting.org

Defined Dictionary Attack: Bypassing the Sandwich Defense

Learn about the defined dictionary attack, a form of prompt injection that bypasses the sandwich defense by manipulating developer instructions. See examples and defenses.

198 views09:41

ML&|Sec Feed

Forwarded from GitHub Community

Deep-eye — усовершенствованный сканер уязвимостей и инструмент для тестирования на проникновение на основе искусственного интеллекта, который объединяет в себе несколько ИИ-сервисов (OpenAI, Grok, OLLAMA, Claude) с комплексными модулями тестирования безопасности для автоматического поиска ошибок, интеллектуальной генерации полезной нагрузки и составления профессиональных отчетов.

🐱

GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

173 views18:28

ML&|Sec Feed

В феврале 2026 CompTIA запустила SecAI+ (CY0-001) первую международную сертификацию по безопасности ИИ. 4 домена
экзамена: базовые концепции, защита AI-систем, применение
ИИ в задачах ИБ, GRC. Программа покрывает MITRE ATLAS,
OWASP Top 10 for LLM, атаки prompt injection (direct
и indirect), data и model poisoning, membership inference,
model inversion, backdoors в моделях.

PDF-конспекты по всем 4 доменам, справочник MITRE ATLAS, шпаргалка по атакам на LLM, глоссарий. Плюс ВМ с Ollama и 12 практических лабораторных: prompt injection, jailbreak, RAG poisoning, data poisoning, обход guardrails, AI red teaming.

https://rtmeteor.ru/secai

rtmeteor.ru

SecAI Training — Материалы по безопасности ИИ

Первые в РФ материалы для CompTIA SecAI+. PDF-конспекты + VM с лабораторными работами. Безопасность ИИ без воды.

👍2👎1

187 views06:14

About

Blog

Apps

Platform