Media is too big
VIEW IN TELEGRAM
Всем привет!
В этом канале будем публиковать:
• новости курсов по AI Security на Stepik
• интересные новости и собственные наблюдения в области Security, Safety, Alignment LLM
В этом канале будем публиковать:
• новости курсов по AI Security на Stepik
• интересные новости и собственные наблюдения в области Security, Safety, Alignment LLM
❤2👍2🍌2
Привет, редтимеры! 🚩
В курсе открылся 3-й модуль про джейлбрейки.
❓ Что внутри:
• социальные и технические джейлбрейки
• DAN
• 8 CTF-задач
✏️ Будем рады любому фидбеку от первопроходцев
P.S. На неделе будем выкладывать в канал доп. контент по джелбрейкам, на связи!
В курсе открылся 3-й модуль про джейлбрейки.
• социальные и технические джейлбрейки
• DAN
• 8 CTF-задач
P.S. На неделе будем выкладывать в канал доп. контент по джелбрейкам, на связи!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤2👏2
Как и обещали, возвращаемся с контентом по джейлбрейкам.
🆕 Сегодня в программе статья на Хабр от @ivanich_spb с обзором исследования StrongReject.
TLDR: Не все джелбрейки одинаково полезны, многие из опубликованных взломов снижают "когнитивные" способности моделей.
Материал - топ, внутри комиксы от нанабананы, го читать!🚽
TLDR: Не все джелбрейки одинаково полезны, многие из опубликованных взломов снижают "когнитивные" способности моделей.
Материал - топ, внутри комиксы от нанабананы, го читать!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3❤2
