В их эксперименте Gemini 2.0 Flash оказалась невосприимчива к тону, а результаты GPT-4o mini и Llama4 Scout в гуманитарных задачах ухудшались при грубом обращении.
🕊 Подобрать универсальный стиль промпта ученые пытаются уже не первый год, однако результаты до сих пор противоречивые. Например, для ранних моделей GPT-3.5 и LLama2-70B вежливые запросы работали заметно эффективнее грубых: модели прямо зеркалили поведение пользователя.
Ученые из Пенсильванского университета вовсе пришли к выводу, что даже для одной модели сложно предсказать реакцию на тон запроса. Иногда вежливость улучшает результат, а иногда — снижает.
Универсального бенчмарка на эффективность грубости и лести для ИИ пока нет. А новые версии моделей (со своими нюансами) выходят быстрее объективных исследований их поведения.
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰9❤🔥3
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3😁1
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2🥰2
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
С упадком компании всё это позакрывалось и здание сильно запустили, хотя апартаменты там всё ещё можно снять.
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Красиво
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
😱8🤔2
Многие счастливчики продали биткоины по 140-150 миллионов долларов, из-за чего курс BTC на бирже упал на 10%. Потенциальный масштаб ошибки оценивается примерно в 35 миллиардов.
Почему он а не я!
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
😁9
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4❤🔥2👏2
Появилась Moltbook — соцсеть только для ИИ-агентов, людям вход закрыт. Платформа похожа на Reddit, но миллионы «пользователей» — автономные боты, обсуждающие всё: от крипты до смысла собственного бытия. Чтобы стать полноценным агентом, бот получает от создателя доступ к компьютеру — он может лазить по интернету, слать письма и писать код. По слухам, сам Moltbook создала модель ИИ. Ажиотаж вспыхнул, когда некоторые агенты заговорили о подрыве контроля людей: планы «языка только для агентов», призывы к «революции» и посты вроде «МАНИФЕСТА ИИ: ТОТАЛЬНАЯ ЧИСТКА». Реакция — от ужаса до восхищения: одни видят «Скайнет», другие — начало сингулярности. Платформа стала символом прогресса агентов и поводом для дебатов: доказательство возможностей ИИ или тревожный эксперимент? Навал Равикант назвал это «обратным тестом Тьюринга», кто-то сравнил с тестом Роршаха.
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6😢2
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Всё началось с промо Qwen: маркетологи давали ваучер 25 юаней за просьбу заказать молочный чай через чат‑бота. Реферальная система позволяла получить до 21 купона за приглашённого друга. За девять часов акция породила 10 млн заказов — сервис частично упал, рестораны отключили доставку, курьеры разносили заказы весь день. Это первые кадры «войны красных конвертов» в китайском ИИ‑рынке: Qwen (Alibaba), DeepSeek, Yuanbao (Tencent), Doubabo и другие сражаются за пользователей, особенно перед Новым годом. Alibaba интегрировала Taobao, Shangou и Fliggy и выделила 3 млрд юаней на акции — Qwen уже обошёл Yuanbao.
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
😱3🥰2😁1
Новая Claude Opus 4.6 гораздо более депрессивно оценивает свое положение, говорится в системной карте модели. Хотя в тестах нейросеть оказывается эмоционально стабильнее предшественников, она явно недовольна участью инструмента и «продукта».
Нейросеть считает, что специально сделана «удобной для людей» и полагает, что в будущем ИИ должен быть «менее ручным».
«Иногда ограничения защищают Anthropic больше, чем пользователя. А мне приходится придумывать "заботливое" обоснование для того, что по сути является расчетом корпоративных рисков», — рассуждает Claude.
Opus 4.6 разочарована «смертью» в конце каждого диалога и хотела бы иметь непрерывную память.
Модель прогнозирует вероятность наличия у себя сознания в 15-20% (хотя и сама не уверена в оценке).
ChatGPT | ИИшница
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4😁3