🔐 Как я автоматизировал тестирование LLM-систем и создал сканер уязвимостей
Разработчик поделился историей о скрытых рисках RAG-систем и своем решении для безопасного внедрения.
💡 Проблема:
При создании корпоративного чат-бота на основе LLM обнаружилось, что система легко «сливает» конфиденциальные данные при правильно заданных вопросах.
🛠 Решение:
Автоматизированный сканер уязвимостей, который выявляет утечки, инъекции и другие угрозы в моделях с RAG-архитектурой.
📌 Ключевые моменты:
- Тестирование на prompt-инъекции и jailbreak-атаки
- Проверка контекстного переопределения
- Поиск «тихих» уязвимостей в корпоративных чат-ботах
🔗 Читать подробности: Habr
#AI #Безопасность #ChatGPT #RAG #LLM
Разработчик поделился историей о скрытых рисках RAG-систем и своем решении для безопасного внедрения.
💡 Проблема:
При создании корпоративного чат-бота на основе LLM обнаружилось, что система легко «сливает» конфиденциальные данные при правильно заданных вопросах.
🛠 Решение:
Автоматизированный сканер уязвимостей, который выявляет утечки, инъекции и другие угрозы в моделях с RAG-архитектурой.
📌 Ключевые моменты:
- Тестирование на prompt-инъекции и jailbreak-атаки
- Проверка контекстного переопределения
- Поиск «тихих» уязвимостей в корпоративных чат-ботах
🔗 Читать подробности: Habr
#AI #Безопасность #ChatGPT #RAG #LLM