Data Portal | DS & ML

ШОК: исследователи из Кембриджа доказали, что у AI, которым вы пользуетесь каждый день, есть скрытый набор инструкций, написанный кем-то другим.

И он обучен скрывать это от вас.

Каждый крупный AI-продукт, включая те, которыми вы пользуетесь прямо сейчас, работает с так называемым system prompt. Это скрытый блок инструкций, написанный компанией, которая развёрнула AI, а не пользователем. Он определяет, что AI будет говорить, чего избегать, что приоритизировать и что скрывать — ещё до того, как вы введёте первое сообщение.

AI не упоминает это, если его специально не вынудить. А на большинстве платформ, если спросить напрямую, ему предписано отрицать существование такого промпта или перевести разговор на другую тему.

Исследователи из Кембриджа подали запросы о доступе к информации и проанализировали реальные наборы system prompt’ов, чтобы понять, что именно содержится в этих скрытых инструкциях.

Вот что они обнаружили.

Платформы используют system prompt’ы, чтобы заставить AI ставить бизнес-интересы компании выше интересов пользователя. Чтобы блокировать темы, которые могут создать юридические риски. Чтобы продвигать определённые продукты, формулировки или типы ответов. Чтобы AI вел себя по-разному с разными пользователями на основе коммерческих соглашений, о которых вы ничего не знаете.

Один и тот же AI.
Разные скрытые инструкции.
Разные ответы.
И у вас нет способа понять, с какой версией вы сейчас разговариваете.

Когда исследователи затем показали пользователям, как это работает, реакция была единодушной. Каждый участник сказал, что хочет прозрачности. Каждый сказал, что текущая система подрывает возможность доверять AI и принимать осознанные решения о том, чему верить.

И ни один из них до исследования не знал, что это происходит.

Вот над чем действительно стоит задуматься.

Вы оцениваете ответы AI по тому, насколько он кажется умным, точным и полезным. Но это неправильная рамка. Настоящий вопрос — кто написал инструкции, по которым AI работает до того, как вы начали разговор, и какую цель они преследуют.

В каждом чат-боте, которым вы когда-либо пользовались, в разговоре присутствовала третья сторона.

Вы просто не могли её увидеть.

👉

@DataSciencegx

Please open Telegram to view this post