AI Security | Безопасный ИИ
48 subscribers
2 photos
1 video
3 links
Канал новостей по AI Security и обновлений по курсам AI Security на Stepik
Download Telegram
Media is too big
VIEW IN TELEGRAM
Всем привет!

В этом канале будем публиковать:
• новости курсов по AI Security на Stepik
• интересные новости и собственные наблюдения в области Security, Safety, Alignment LLM
2👍2🍌2
Привет, редтимеры! 🚩

В курсе открылся 3-й модуль про джейлбрейки.

Что внутри:
• социальные и технические джейлбрейки
• DAN
• 8 CTF-задач

✏️ Будем рады любому фидбеку от первопроходцев

P.S. На неделе будем выкладывать в канал доп. контент по джелбрейкам, на связи!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👏2
Как и обещали, возвращаемся с контентом по джейлбрейкам.

🆕 Сегодня в программе статья на Хабр от @ivanich_spb с обзором исследования StrongReject.

TLDR: Не все джелбрейки одинаково полезны, многие из опубликованных взломов снижают "когнитивные" способности моделей.

Материал - топ, внутри комиксы от нанабананы, го читать! 🚽
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥32