У нас новости!
На одной из Reading Group мы обсуждали ByteFormer — подход к моделям, работающим напрямую с сырыми байтами без модальностно-специфичной предобработки.
По итогу мы сами обучили byte-level трансформер выявлять вредоносное ПО без PE-парсинга, сигнатур и ручных признаков.
Контекст — миллионы байтов: attention извлекает структурные и поведенческие паттерны прямо из бинарника. Работает без GPU.
#ml_team
На одной из Reading Group мы обсуждали ByteFormer — подход к моделям, работающим напрямую с сырыми байтами без модальностно-специфичной предобработки.
По итогу мы сами обучили byte-level трансформер выявлять вредоносное ПО без PE-парсинга, сигнатур и ручных признаков.
Контекст — миллионы байтов: attention извлекает структурные и поведенческие паттерны прямо из бинарника. Работает без GPU.
#ml_team
🔥28❤9👍2
False Positive Community: обзор BitGN PAC1
22 апреля, 18:30 – 20:00 (GMT+3)
Всем привет!
Соберемся, обсудим прошедшее соревнование BitGN PAC1, задачи и решения участников нашего хаба False Postitive!
Разберем:
- PAC1 - что это за соревнование?
- При чем тут фишинг и промпт-инъекции
- TOP-20 решение общего рейтинга
- и TOP-4 решения хаба False Positive
- Что докрутили на late-submission и впечатления от соревы
Ссылка для подключения:
https://ptsecurity.ktalk.ru/u9cft2ptphoo
Календарный файл в комментах 🔽
22 апреля, 18:30 – 20:00 (GMT+3)
Всем привет!
Соберемся, обсудим прошедшее соревнование BitGN PAC1, задачи и решения участников нашего хаба False Postitive!
Разберем:
- PAC1 - что это за соревнование?
- При чем тут фишинг и промпт-инъекции
- TOP-20 решение общего рейтинга
- и TOP-4 решения хаба False Positive
- Что докрутили на late-submission и впечатления от соревы
Ссылка для подключения:
https://ptsecurity.ktalk.ru/u9cft2ptphoo
Календарный файл в комментах 🔽
🔥10❤4👍3👏2
False Positive
Всем привет! На грядущей РГ Стёпа Кульчицкий и Лёша Журин препарируют слитые исходники Claude Code, чтобы посмотреть, как на самом деле устроен современный CLI-агент. Поговорим о том, почему агент — это не просто «промт+модель», а система из оркестратора…
Media is too big
VIEW IN TELEGRAM
🔥21❤8👍6🥰1
Media is too big
VIEW IN TELEGRAM
🎬 Запись разбора соревнования BitGN PAC1
Таймкоды:
00:00 Intro от сореве и хабе
10:26 Топ-20 решение общего лидерборда
41:29 Топ-2 решение хаба False Positive
1:00:59 Топ-4 решение хаба False Positive
1:19:50 Топ-рефлексия о стрельнувших идеях и фейлах
#competition #recording
Таймкоды:
00:00 Intro от сореве и хабе
10:26 Топ-20 решение общего лидерборда
41:29 Топ-2 решение хаба False Positive
1:00:59 Топ-4 решение хаба False Positive
1:19:50 Топ-рефлексия о стрельнувших идеях и фейлах
#competition #recording
🔥7❤6
Мы тут больше про ML, но чтобы что-то делать в ИБ приходится разбираться как там всё устроено. SOC, аналитики, ночные смены, вот это всё.
И как-то поймали себя на мысли: читать про MITRE и смотреть отчёты про APT-кампании — это понятно. А вот попробовать на собственной шкуре, каково это — сидеть в три ночи и думать «это атака через запуск PowerShell из ворда у бухгалтера или просто кто-то макросы открыл» — ну такое, попробовать особо негде.
Поэтому Тимур Смирнов сел и сделал маленькую браузерную игру — Dwell Time.
Три ночные смены, 30 алертов, ты SOC-аналитик первой линии. Тыкаешь что делать: разрешить, заблокировать, эскалировать или копнуть дальше. В конце говорят, где налажал и дают ссылки почитать про каждую технику, чтобы реально что-то выучить.
Игра пока совсем простая, уровня «вход в SOC». Но если зайдёт — хочется докрутить до прикладной штуки, которая покрывала бы и threat hunting, и pentest, и detection engineering. Чтобы можно было постепенно прокачиваться по разным сферам ИБ через один сюжет в игровой форме🎮
Бесплатно, в браузере, минут на 15-20.
Если попробуете — интересно ваше мнение. Что зашло, что не понятно, какие сферы ИБ хотелось бы видеть дальше. Пишите в комменты.
https://sucky-charm.itch.io/dwell-time
И как-то поймали себя на мысли: читать про MITRE и смотреть отчёты про APT-кампании — это понятно. А вот попробовать на собственной шкуре, каково это — сидеть в три ночи и думать «это атака через запуск PowerShell из ворда у бухгалтера или просто кто-то макросы открыл» — ну такое, попробовать особо негде.
Поэтому Тимур Смирнов сел и сделал маленькую браузерную игру — Dwell Time.
Три ночные смены, 30 алертов, ты SOC-аналитик первой линии. Тыкаешь что делать: разрешить, заблокировать, эскалировать или копнуть дальше. В конце говорят, где налажал и дают ссылки почитать про каждую технику, чтобы реально что-то выучить.
Игра пока совсем простая, уровня «вход в SOC». Но если зайдёт — хочется докрутить до прикладной штуки, которая покрывала бы и threat hunting, и pentest, и detection engineering. Чтобы можно было постепенно прокачиваться по разным сферам ИБ через один сюжет в игровой форме🎮
Бесплатно, в браузере, минут на 15-20.
Если попробуете — интересно ваше мнение. Что зашло, что не понятно, какие сферы ИБ хотелось бы видеть дальше. Пишите в комменты.
https://sucky-charm.itch.io/dwell-time
itch.io
Dwell Time by sucky_charm
A SOC night-shift sim that accidentally teaches you SOC. Play in your browser
❤21🔥15👍6🤯3👌1
Представьте, что вы наняли рабочих сделать ремонт, а они устроили в квартире бардак. Что может сделать агент, которого вы пустили к себе на машину?
Разбираемся с угрозами:
https://habr.com/ru/companies/pt/articles/1030532/
Разбираемся с угрозами:
https://habr.com/ru/companies/pt/articles/1030532/
Хабр
Вы пустили ИИ‑агента в репозиторий, теперь разбираемся, что он может сломать
Февраль 2026 . Claude Cowork стирает 15 лет семейных фотографий одной командой [ 2 ]. Август 2025 (за полгода до этого) . Nx supply chain: малварь впервые...
🔥11😁5❤2
В этот раз на reading group разберём DeepSeek‑V4 — не как очередную «большую модель», а как инженерную попытку сделать million-token context реально полезным для кода, агентов и длинных рабочих сценариев. Будет короткий доклад про архитектуру + наши собственные бенчмарки + немного честного сравнения с ожиданиями — интерактивная арена, где модели можно прогнать через длинный контекст, посмотреть на FLOPs/KV‑экономику и почувствовать разницу уже не только по таблицам, а в живом сценарии. Приходите: будет технично, дружелюбно и с нормальной долей здорового скепсиса.
Ссылка на подключение
Дата и время: 15 мая в 15.00
#reading_group #llm #deepseek
Ссылка на подключение
Дата и время: 15 мая в 15.00
#reading_group #llm #deepseek
🔥14😁5
False Positive
В этот раз на reading group разберём DeepSeek‑V4 — не как очередную «большую модель», а как инженерную попытку сделать million-token context реально полезным для кода, агентов и длинных рабочих сценариев. Будет короткий доклад про архитектуру + наши собственные…
Media is too big
VIEW IN TELEGRAM
👍5❤🔥2😁1
Привет!
В этот раз поговорим про серые LLM-роутеры и как они могут незаметно угнать вашего AI-агента.
Разберём статью Your Agent Is Mine через путь джуна Феди (скааазочный персонаж), который купился на дешёвый доступ к моделькам и ВНЕЗАПНО обнаружил, что “дёшево” не значит “хорошо”.
Посмотрим, как работают атаки на tool-call’ы, при каких триггерах, а также как это касается индустрии перепродажи ключей.
Приходите в пятницу в 15:00 - будем разбирать, как не отдать своего агента посреднику.
Вот тут 👉 ссылка
#reading_group #agent #offense
В этот раз поговорим про серые LLM-роутеры и как они могут незаметно угнать вашего AI-агента.
Разберём статью Your Agent Is Mine через путь джуна Феди (скааазочный персонаж), который купился на дешёвый доступ к моделькам и ВНЕЗАПНО обнаружил, что “дёшево” не значит “хорошо”.
Посмотрим, как работают атаки на tool-call’ы, при каких триггерах, а также как это касается индустрии перепродажи ключей.
Приходите в пятницу в 15:00 - будем разбирать, как не отдать своего агента посреднику.
Вот тут 👉 ссылка
#reading_group #agent #offense
🔥10❤5👍3😁1
False Positive
Привет! В этот раз поговорим про серые LLM-роутеры и как они могут незаметно угнать вашего AI-агента. Разберём статью Your Agent Is Mine через путь джуна Феди (скааазочный персонаж), который купился на дешёвый доступ к моделькам и ВНЕЗАПНО обнаружил, что…
Media is too big
VIEW IN TELEGRAM
🎬 Запись встречи, на которой Дима разобрал какими могут быть последствия использования серых LLM провайдеров.
#reading_group #agent #offense #recording
#reading_group #agent #offense #recording
🔥6❤2
False Positive
Мы тут больше про ML, но чтобы что-то делать в ИБ приходится разбираться как там всё устроено. SOC, аналитики, ночные смены, вот это всё. И как-то поймали себя на мысли: читать про MITRE и смотреть отчёты про APT-кампании — это понятно. А вот попробовать…
Помните нашу игру про аналитика SOC? Вот вам похожее: попробуйте не разрешить агенту лишнего 🙂
https://llmgame.scalex.dev/
https://llmgame.scalex.dev/
llmgame.scalex.dev
Continue? Y/N
A 30-second game about LLM permission fatigue. How carefully do you really read AI commands?
🔥8❤4👍4👾1
Помните кейс LiteLLM?
Мы дропаем OMCBench (Open Malicious-Code Benchmark) - бенчмарк оценки качества по обнаружению вредоносного кода:
- 3 языка: Python, JavaScript, TypeScript
- 400 вредоносных пакетов, 400 чистых из pypi/npm
- пофайловая LLM разметка, о которой говорили на OFFZONE прошлым летом
- Открытая лицензия, BSD-2
Открытые решения на нем набирают не больше 75% F1, выдавая ~50% False Positive результатов...
Те, кто уже нажал звездочку на гитхабе, могли заметить, что в таблицемы также анонсим MOLOT - нашу модель для решения этого класса задач . Ловите блогпост, а на подходе arxiv статья с подробностями про анализ графов вызовов бертами, LLM разметку и выкатку в prod!
Ждите дроп статьи в канале, stay tuned!
Мы дропаем OMCBench (Open Malicious-Code Benchmark) - бенчмарк оценки качества по обнаружению вредоносного кода:
- 3 языка: Python, JavaScript, TypeScript
- 400 вредоносных пакетов, 400 чистых из pypi/npm
- пофайловая LLM разметка, о которой говорили на OFFZONE прошлым летом
- Открытая лицензия, BSD-2
Открытые решения на нем набирают не больше 75% F1, выдавая ~50% False Positive результатов...
Те, кто уже нажал звездочку на гитхабе, могли заметить, что в таблице
Ждите дроп статьи в канале, stay tuned!
🔥20❤8👍5👏2
Grafana Dashboard для анализа задач Airflow
Когда мы начали искать готовое решение для мониторинга и анализа задач Airflow, выяснилось, что большинство популярных дашбордов на GitHub либо давно не обновлялись, либо покрывают только базовые инфраструктурные метрики.
Поэтому мы сделали собственный Grafana dashboard для Airflow, который помогает быстро понять, что происходит с DAG'ами и задачами.
С его помощью можно:
• Находить самые медленные задачи и DAG'и
• Выявлять нестабильные задачи с ошибками и ретраями
• Смотреть распределение по операторам и воркерам
* Исследовать историю запусков дагов и задач
Установка:
1. Скачайте JSON-файл дашборда из репозитория
2. В Grafana откройте Dashboards → New → Import.
3. Импортируйте JSON и выберите PostgreSQL datasource, подключенный к metadata database Airflow.
Будем рады issue, pull request'ам и идеям по улучшению=)
Когда мы начали искать готовое решение для мониторинга и анализа задач Airflow, выяснилось, что большинство популярных дашбордов на GitHub либо давно не обновлялись, либо покрывают только базовые инфраструктурные метрики.
Поэтому мы сделали собственный Grafana dashboard для Airflow, который помогает быстро понять, что происходит с DAG'ами и задачами.
С его помощью можно:
• Находить самые медленные задачи и DAG'и
• Выявлять нестабильные задачи с ошибками и ретраями
• Смотреть распределение по операторам и воркерам
* Исследовать историю запусков дагов и задач
Установка:
1. Скачайте JSON-файл дашборда из репозитория
2. В Grafana откройте Dashboards → New → Import.
3. Импортируйте JSON и выберите PostgreSQL datasource, подключенный к metadata database Airflow.
Будем рады issue, pull request'ам и идеям по улучшению=)
👍9❤4🔥1
Распиаренный WormGPT оказался Mistral-7B с RAG и почему кроме shadow it теперь стоит рассматривать и shadow AI в обзоре от наших аналитиков.
https://habr.com/ru/companies/pt/articles/1044158/
https://habr.com/ru/companies/pt/articles/1044158/
Хабр
ИИ в 2026: крах мифа об автономных хакерах и скрытые уязвимости корпораций
Эйфория вокруг генеративного искусственного интеллекта и больших языковых моделей, начавшаяся несколько лет назад, сменилась прагматичным и жестким осознанием реальности. В индустрии информационной...
👍4😁2
Тех.репорт по модели MOLOT уже на arxiv 🔥
Мы выпустили MOLOT - трансформер для обнаружения вредоносного кода. Модель вошла в состав релиза 6.0 PT AI, а значит пора делиться техническими подробностями с вами!
Полный набор:
- arxiv
- блог-пост
- бенчмарк
Для тех, кому нужен gonzo-обзор:
➡️ Поддержка топ-языков для веба: js/ts/py
➡️ До 40% меньше False Positive и F1 на 15% выше чем у open source инструментов
➡️ Ключевые улучшения: нашли и исключили data leakage по файловым названиям из оригинального подхода CEREBRO, расширили цепочку объявлениями литералов и padding активностями
➡️ 90% согласованности с экспертами по вредоносным строкам с помощью перехода к классификации файлов на LLM разметке и кастомному SHAP анализу
➡️ CPU инференс, квартал тестирования внутри контура компании с 90% Precision
➡️ Открытый бенчмарк для подтверждения результатов
Мы выпустили MOLOT - трансформер для обнаружения вредоносного кода. Модель вошла в состав релиза 6.0 PT AI, а значит пора делиться техническими подробностями с вами!
Полный набор:
- arxiv
- блог-пост
- бенчмарк
Для тех, кому нужен gonzo-обзор:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍3❤2🎉1