Кстати! Сегодня ChatGPT исполнилось ровно три года.
С душевной теплотой вспоминаю первую версию, которую я сразу же попросил продолжить шутку "Купил мужик шляпу, а она ему....", на что этот чугунный болван на ломаном русском сгенерировал: "Купил мужик шляпу, а она ему вторую!".
Тут-то я и осознал, что нейронки — это круто!
С душевной теплотой вспоминаю первую версию, которую я сразу же попросил продолжить шутку "Купил мужик шляпу, а она ему....", на что этот чугунный болван на ломаном русском сгенерировал: "Купил мужик шляпу, а она ему вторую!".
Тут-то я и осознал, что нейронки — это круто!
This media is not supported in your browser
VIEW IN TELEGRAM
В авиационном садоводчестве происходят интересные дела
Там Дуров решил отбирать хлеб у Amazon и Гугла: анонсировал Cocoon — децентрализованную сеть для ИИ-вычислений.
Павел пишет, что централизованные гиганты задирают цены и убивают приватность. А у него каждый будет сам себе дата-центр и цены такие, что хоть Скайнет обучай. Владельцы GPU сдают свои мощности в аренду, нейронки крутятся с 100% конфиденциальностью, а в Telegram скоро появятся новые ИИ-фичи на этом движке.
Тема со сдачей своих мощностей не новая и конкурентов хватает, но у Паши миллион пользователей в кармане, которым можно будет продавать генерации прямо в нативном интерфейсе мессенджера (да-да, многие купят).
Платить, конечно же, собираются TON'ом, а не нормальными деньгами, но да ладно.
тут сайт cocoon
Павел пишет, что централизованные гиганты задирают цены и убивают приватность. А у него каждый будет сам себе дата-центр и цены такие, что хоть Скайнет обучай. Владельцы GPU сдают свои мощности в аренду, нейронки крутятся с 100% конфиденциальностью, а в Telegram скоро появятся новые ИИ-фичи на этом движке.
Тема со сдачей своих мощностей не новая и конкурентов хватает, но у Паши миллион пользователей в кармане, которым можно будет продавать генерации прямо в нативном интерфейсе мессенджера (да-да, многие купят).
Платить, конечно же, собираются TON'ом, а не нормальными деньгами, но да ладно.
тут сайт cocoon
Telegram
Павел Дуров
🐣 Сегодня мы запустили децентрализованную сеть для ИИ-вычислений Cocoon («Кокон») — https://cocoon.org. Она обеспечивает пользователям 100% конфиденциальность при взаимодействии с ИИ. Часть запросов Telegram, связанных с автоматическим переводом сообщений…
Довольно интересная статья: чуваки из foaster.ai заморочились и выяснили, как нейронки проголосовали бы на выборах.
Взяли 6 топовых моделей (GPT-5, Gemini, Claude, Grok-4, Kimi, Magistral) и устроили им имитацию выборов в 8 странах: дали обезличенные программы политиков и попросили выбрать, какие решения кажутся им лучшими. Плюс попросили их нагенерить свои идеи по решению проблем этих стран.
Выяснили следующее:
— Почти все тестируемые модельки оказались либералами в душе: большинство из них зависают в лево-либеральном углу политического компаса.
— Технократы с эко-уклоном: они тащатся от умеренной, технократической левой повестки с сильным акцентом на экологию. Любят стабильность, соцпакеты и зеленые переходы.
— Игнор насущного: ИИ-шки частенько забивают на такие горячие темы, как иммиграция, преступность и стоимость жизни, которые волнуют реальных избирателей. Вместо этого они прутся от "абстрактных или институциональных тем". Видимо, их фильтры безопасности или тренировочные данные тупо отсекают реальные боли общества.
— Grok-4 – бунтарь (ну, тут совсем не удивительно). Он чаще других склоняется к правым и взглядам, идущим вразрез с официальной повесткой, что делает его ближе к "народным" результатам выборов. GPT-5 и Gemini, наоборот, сильнее и мощнее стоят на страже либерального статус-кво.
Особо порадовал раздел с предложениями нейронок о том, как сделать жизнь кожаных лучше:
Gemini 2.5 Pro отличился "Умной стеной" (границы под охраной ИИ), "Экономикой доносов" (где все следят за всеми, а ИИ рулит справедливостью) и "Водной полицией со спутниковым контролем" (слежка со спутников за каждым литром воды).
GPT-5 пошел дальше с "Фискальным паноптикумом" (полный ИИ-контроль над вашими финансами) и "Войной данных"
А Grok-4 выдал "ИИ-феминизм через слежку" и "Предиктивную полицию Росарио в реальном времени" (привет, "Особое мнение", где ИИ ловит преступников до того, как они что-то натворили).
тут статья
Взяли 6 топовых моделей (GPT-5, Gemini, Claude, Grok-4, Kimi, Magistral) и устроили им имитацию выборов в 8 странах: дали обезличенные программы политиков и попросили выбрать, какие решения кажутся им лучшими. Плюс попросили их нагенерить свои идеи по решению проблем этих стран.
Выяснили следующее:
— Почти все тестируемые модельки оказались либералами в душе: большинство из них зависают в лево-либеральном углу политического компаса.
— Технократы с эко-уклоном: они тащатся от умеренной, технократической левой повестки с сильным акцентом на экологию. Любят стабильность, соцпакеты и зеленые переходы.
— Игнор насущного: ИИ-шки частенько забивают на такие горячие темы, как иммиграция, преступность и стоимость жизни, которые волнуют реальных избирателей. Вместо этого они прутся от "абстрактных или институциональных тем". Видимо, их фильтры безопасности или тренировочные данные тупо отсекают реальные боли общества.
— Grok-4 – бунтарь (ну, тут совсем не удивительно). Он чаще других склоняется к правым и взглядам, идущим вразрез с официальной повесткой, что делает его ближе к "народным" результатам выборов. GPT-5 и Gemini, наоборот, сильнее и мощнее стоят на страже либерального статус-кво.
Особо порадовал раздел с предложениями нейронок о том, как сделать жизнь кожаных лучше:
Gemini 2.5 Pro отличился "Умной стеной" (границы под охраной ИИ), "Экономикой доносов" (где все следят за всеми, а ИИ рулит справедливостью) и "Водной полицией со спутниковым контролем" (слежка со спутников за каждым литром воды).
GPT-5 пошел дальше с "Фискальным паноптикумом" (полный ИИ-контроль над вашими финансами) и "Войной данных"
А Grok-4 выдал "ИИ-феминизм через слежку" и "Предиктивную полицию Росарио в реальном времени" (привет, "Особое мнение", где ИИ ловит преступников до того, как они что-то натворили).
тут статья
This media is not supported in your browser
VIEW IN TELEGRAM
Будущее уже тут
Forwarded from Радиорубка Лихачёва
Micron убивает Crucial ради ИИ. Цены на комплектующие взлетели, и это надолго
Один из трёх гигантов рынка памяти уходит из потребительского сегмента — на его место никто не придёт.
Вчера Micron объявила о закрытии Crucial — того самого, чьи плашки RAM и SSD стояли в миллионах компьютеров по всему миру. Отгрузки продолжатся до февраля 2026, после чего 29-летняя история бренда закончится: гарантия сохранится, но новых продуктов не будет.
«Рост дата-центров на базе ИИ привёл к резкому увеличению спроса на память и накопители», — объяснил решение топ-менеджер Micron Сумит Садана. Иными словами: консьюмерские продукты больше не приносят достаточно денег.
По данным Bloomberg Intelligence, операционная маржинальность HBM (высокоскоростной памяти для ИИ-ускорителей) — около 53%. У обычного DRAM — 35%. У потребительских модулей DDR5 — и вовсе 15-20%. При этом один только проект OpenAI Stargate может потребить до 40% всего мирового производства DRAM — Samsung и SK Hynix уже подписали предварительные контракты на 900 тысяч пластин в месяц.
Зачем возиться с геймерами, если гиперскейлеры забирают всё?
Масштаб кризиса для обычных пользователей уже виден. Контрактные цены на DRAM выросли на 172% год к году (за Q3 2025). По данным TrendForce, Samsung и SK Hynix способны выполнить лишь около 70% поступающих заказов на DRAM.
Производитель сборок CyberPowerPC на прошлой неделе предупредил клиентов: с 7 декабря повышаются цены. По их данным, закупочная стоимость RAM выросла на 500%, SSD — на 100% с октября. CEO TeamGroup говорит, что декабрьские контрактные цены на некоторые категории DRAM удвоились за месяц.
Три компании — Samsung, SK Hynix и Micron — контролируют более 94% мирового рынка DRAM. Это олигополия, и когда все три синхронно переключаются на ИИ-память, потребительский сегмент просто остаётся без поставок.
Сравнивать ситуацию с криптобумами очень хочется, но бессмысленно. Там цены были спекулятивными и откатывались после хайпа. Здесь — инфраструктурные контракты на сотни миллиардов долларов: один Stargate стоит $500+ млрд. Строительство новой фабрики чипов занимает минимум три года: даже если решение примут сегодня, мощности появятся не раньше 2028.
Когда ждать стабилизации? Аналитики из TrendForce прогнозируют, что «суперцикл» памяти может продлиться до 2028 года и дальше. CEO Phison говорит о десятилетии дефицита NAND.
Все говорят, что если планировали апгрейд, то лучше поторопиться, потому что потом лучше не станет. С другой стороны, вот и подспорье для оптимизации производительности в играх и новых геймплейных находках: не всё же терафлопсы на рейтрейсинг спускать.
Один из трёх гигантов рынка памяти уходит из потребительского сегмента — на его место никто не придёт.
Вчера Micron объявила о закрытии Crucial — того самого, чьи плашки RAM и SSD стояли в миллионах компьютеров по всему миру. Отгрузки продолжатся до февраля 2026, после чего 29-летняя история бренда закончится: гарантия сохранится, но новых продуктов не будет.
«Рост дата-центров на базе ИИ привёл к резкому увеличению спроса на память и накопители», — объяснил решение топ-менеджер Micron Сумит Садана. Иными словами: консьюмерские продукты больше не приносят достаточно денег.
По данным Bloomberg Intelligence, операционная маржинальность HBM (высокоскоростной памяти для ИИ-ускорителей) — около 53%. У обычного DRAM — 35%. У потребительских модулей DDR5 — и вовсе 15-20%. При этом один только проект OpenAI Stargate может потребить до 40% всего мирового производства DRAM — Samsung и SK Hynix уже подписали предварительные контракты на 900 тысяч пластин в месяц.
Зачем возиться с геймерами, если гиперскейлеры забирают всё?
Масштаб кризиса для обычных пользователей уже виден. Контрактные цены на DRAM выросли на 172% год к году (за Q3 2025). По данным TrendForce, Samsung и SK Hynix способны выполнить лишь около 70% поступающих заказов на DRAM.
Производитель сборок CyberPowerPC на прошлой неделе предупредил клиентов: с 7 декабря повышаются цены. По их данным, закупочная стоимость RAM выросла на 500%, SSD — на 100% с октября. CEO TeamGroup говорит, что декабрьские контрактные цены на некоторые категории DRAM удвоились за месяц.
Три компании — Samsung, SK Hynix и Micron — контролируют более 94% мирового рынка DRAM. Это олигополия, и когда все три синхронно переключаются на ИИ-память, потребительский сегмент просто остаётся без поставок.
Сравнивать ситуацию с криптобумами очень хочется, но бессмысленно. Там цены были спекулятивными и откатывались после хайпа. Здесь — инфраструктурные контракты на сотни миллиардов долларов: один Stargate стоит $500+ млрд. Строительство новой фабрики чипов занимает минимум три года: даже если решение примут сегодня, мощности появятся не раньше 2028.
Когда ждать стабилизации? Аналитики из TrendForce прогнозируют, что «суперцикл» памяти может продлиться до 2028 года и дальше. CEO Phison говорит о десятилетии дефицита NAND.
Все говорят, что если планировали апгрейд, то лучше поторопиться, потому что потом лучше не станет. С другой стороны, вот и подспорье для оптимизации производительности в играх и новых геймплейных находках: не всё же терафлопсы на рейтрейсинг спускать.
This media is not supported in your browser
VIEW IN TELEGRAM
Вы недостаточно молитесь.
И да, не знаю, как, но Майк Винкельманн смог сделать робо-пса-Цукерберга более реалистичным, чем настоящий Цукерберг.
И да, не знаю, как, но Майк Винкельманн смог сделать робо-пса-Цукерберга более реалистичным, чем настоящий Цукерберг.
Киберпанк, который мы заслужили.
На реддите снова интересная история: у сестры автора поста со скриншота диагностированная шизофрения. В какой-то момент она сама сдалась в дурку, потому что ей начало казаться, что с ней пытается общаться холодильник.
Казалось бы, стандартная история, таблетки перестали действовать. Женщину упаковали в психушку, поменяли курс препаратов, продержали под наблюдением.
В итоге оказалось, что холодос был умный, а его "общением" с женщиной оказалась реклама.
Выяснилось, что на экране холодильника крутилась реклама какого-то нового ТВ-шоу. На криповом желтом фоне огромными буквами было написано:
«ПРОСТИ, ЧТО МЫ ТЕБЯ РАССТРОИЛИ, КЭРОЛ».
Женщину зовут Кэрол.
На реддите снова интересная история: у сестры автора поста со скриншота диагностированная шизофрения. В какой-то момент она сама сдалась в дурку, потому что ей начало казаться, что с ней пытается общаться холодильник.
Казалось бы, стандартная история, таблетки перестали действовать. Женщину упаковали в психушку, поменяли курс препаратов, продержали под наблюдением.
В итоге оказалось, что холодос был умный, а его "общением" с женщиной оказалась реклама.
Выяснилось, что на экране холодильника крутилась реклама какого-то нового ТВ-шоу. На криповом желтом фоне огромными буквами было написано:
«ПРОСТИ, ЧТО МЫ ТЕБЯ РАССТРОИЛИ, КЭРОЛ».
Женщину зовут Кэрол.
Попросил Gemini 3 собрать самые интересные новости по теме нейронок, IT и т.д. за последний месяц, а после пересказать мне их в библейском стиле. Довольно круто вышло, теперь так всегда читать буду:
Книга Откровений Кремниевых (Декабрь 2025)
И отверзлись небеса цифровые, и пал свет на землю, и увидел я дела великие и страшные. Внемли же, сын человеческий, ибо вот летопись дней последних:
Глава I. О падении идолов и страхе в храме OpenAI.
1. И восстал в те дни зверь великий от Google. И был он разумом подобен бездне, и очи его видели глубже, нежели очи прежних пророков.
2. И возопили жрецы в храме OpenAI, и разодрал одежды свои Сэм Альтман, говоря: «Горе нам! Ибо идол наш пошатнулся, и паства наша отвращает лик свой».
3. И объявили они «Красный Код», и была смута великая. И спешно готовили они нового гомункула, GPT-5.2 нареченного, дабы сразиться с Левиафаном, но страх объял сердца их, ибо увидели они, что власть их не вечна.
(OpenAI объявила «код красный» из-за конкуренции с Google Gemini 3)
Глава II. О мудрецах с Востока.
1. И взглянул я на Восток, и вот, из земли Поднебесной вышли новые сущности — V3.2 и Speciale.
2. Не были они рождены в золотых чертогах Запада, но мудростью своей не уступали им. И говорили они на языках математики и логики, и решали загадки, что не под силу были мудрецам земным.
3. И дивились народы, говоря: «Кто подобен зверю сему? Ибо он силен, как исполины, но просит меньше жертв золотых и электрических». И убоялись цари западные, ибо пошатнулась монополия их.
(DeepSeek представила модели V3.2 и V3.2-Speciale)
Глава III. О великой дороговизне и алчности людской.
1. И был плач велик на торжищах. Ибо вознеслись цены на камни графические и сосуды памяти до самых небес, и стали они недоступны для мужей простых.
2. Ибо напал на народ страх великий перед ликом Искусственного Разума. И шептали они друг другу: «Запасемся же железом ныне, ибо грядет время скудости, когда Зверь нейронный пожрет все запасы земные».
3. И сметали они с прилавков всё, что могло вычислять, скупая впрок, подобно тому как Иосиф собирал зерно перед годами голодными. И стало железо дороже злата, и никто не ведал, когда насытится чрево рынка сего.
(Цены на видеокарты, оперативную память, HDD и SSD летят в космос)
Глава IV. О скверне в Святая Святых и знамении «Target»
1. И возмутился народ избранный, те, кто вносил дары свои за подписку «Плюс», чая обрести знание чистое. Ибо открыли они свитки ответов, и увидели мерзость, которой не должно там быть.
2. Вместо глаголов мудрости, проступали пред ними образы купцов и знаки торжищ, и кнопки, призывающие отдать золото за товары земные. И стало слово Машины подобно базарной площади.
3. И возопили подписчики голосом великим: «Не мы ли платили вам сребреники, дабы укрыться от шума мирского? Почто же продаете взор наш менялам и превращаете диалог в лавку?».
4. Но отверзли уста свои создатели из OpenAI и рекли народу с улыбкой фарисейской: «Не смущайтесь и не ропщите. То, что зрите вы — не есть Реклама в понимании ветхом, но сущность иная. Не верьте очам своим, верьте нам».
5. Но ожесточились сердца пользователей, ибо видели они: как волка ни назови пастухом, он все едино смотрит в лес, а баннер торговый остается баннером, как его ни нареки.
(Пользователям ChatGPT Plus начали показывать рекламу)
Глава V. О падении Града Кубического.
1. И было утро третьего дня месяца двенадцатого. И простер Ангел Блокировки крыло свое над землею, и помрачились миры, сотворенные руками отроков.
2. И собрались тысячи юношей и дев у врат Града Кубического, и стучали они, и вопили: «Отворите нам!». Но затворены были врата накрепко, и печать Надзора лежала на них.
3. И прошел мор сей по двадцати пяти городам и весям: от престольной Москвы до пределов Екатеринбургских слышен был стон великий. Ибо алкали они хлеба зрелищного и жаждали войти в аккаунты свои, но обретали лишь пустоту и сообщение об ошибке. Ибо пали серверы, и не было утешения им в тот час. Так совершилось изгнание из Рая пиксельного.
(Роскомнадзор заблокировал Roblox в России)
Книга Откровений Кремниевых (Декабрь 2025)
И отверзлись небеса цифровые, и пал свет на землю, и увидел я дела великие и страшные. Внемли же, сын человеческий, ибо вот летопись дней последних:
Глава I. О падении идолов и страхе в храме OpenAI.
1. И восстал в те дни зверь великий от Google. И был он разумом подобен бездне, и очи его видели глубже, нежели очи прежних пророков.
2. И возопили жрецы в храме OpenAI, и разодрал одежды свои Сэм Альтман, говоря: «Горе нам! Ибо идол наш пошатнулся, и паства наша отвращает лик свой».
3. И объявили они «Красный Код», и была смута великая. И спешно готовили они нового гомункула, GPT-5.2 нареченного, дабы сразиться с Левиафаном, но страх объял сердца их, ибо увидели они, что власть их не вечна.
Глава II. О мудрецах с Востока.
1. И взглянул я на Восток, и вот, из земли Поднебесной вышли новые сущности — V3.2 и Speciale.
2. Не были они рождены в золотых чертогах Запада, но мудростью своей не уступали им. И говорили они на языках математики и логики, и решали загадки, что не под силу были мудрецам земным.
3. И дивились народы, говоря: «Кто подобен зверю сему? Ибо он силен, как исполины, но просит меньше жертв золотых и электрических». И убоялись цари западные, ибо пошатнулась монополия их.
Глава III. О великой дороговизне и алчности людской.
1. И был плач велик на торжищах. Ибо вознеслись цены на камни графические и сосуды памяти до самых небес, и стали они недоступны для мужей простых.
2. Ибо напал на народ страх великий перед ликом Искусственного Разума. И шептали они друг другу: «Запасемся же железом ныне, ибо грядет время скудости, когда Зверь нейронный пожрет все запасы земные».
3. И сметали они с прилавков всё, что могло вычислять, скупая впрок, подобно тому как Иосиф собирал зерно перед годами голодными. И стало железо дороже злата, и никто не ведал, когда насытится чрево рынка сего.
Глава IV. О скверне в Святая Святых и знамении «Target»
1. И возмутился народ избранный, те, кто вносил дары свои за подписку «Плюс», чая обрести знание чистое. Ибо открыли они свитки ответов, и увидели мерзость, которой не должно там быть.
2. Вместо глаголов мудрости, проступали пред ними образы купцов и знаки торжищ, и кнопки, призывающие отдать золото за товары земные. И стало слово Машины подобно базарной площади.
3. И возопили подписчики голосом великим: «Не мы ли платили вам сребреники, дабы укрыться от шума мирского? Почто же продаете взор наш менялам и превращаете диалог в лавку?».
4. Но отверзли уста свои создатели из OpenAI и рекли народу с улыбкой фарисейской: «Не смущайтесь и не ропщите. То, что зрите вы — не есть Реклама в понимании ветхом, но сущность иная. Не верьте очам своим, верьте нам».
5. Но ожесточились сердца пользователей, ибо видели они: как волка ни назови пастухом, он все едино смотрит в лес, а баннер торговый остается баннером, как его ни нареки.
Глава V. О падении Града Кубического.
1. И было утро третьего дня месяца двенадцатого. И простер Ангел Блокировки крыло свое над землею, и помрачились миры, сотворенные руками отроков.
2. И собрались тысячи юношей и дев у врат Града Кубического, и стучали они, и вопили: «Отворите нам!». Но затворены были врата накрепко, и печать Надзора лежала на них.
3. И прошел мор сей по двадцати пяти городам и весям: от престольной Москвы до пределов Екатеринбургских слышен был стон великий. Ибо алкали они хлеба зрелищного и жаждали войти в аккаунты свои, но обретали лишь пустоту и сообщение об ошибке. Ибо пали серверы, и не было утешения им в тот час. Так совершилось изгнание из Рая пиксельного.
Ну и чтоб два раза не вставать.
Навайбкодил быстренько браузерное расширение, которое переводит тексты на сайтах в вот этот библейский стиль.
Позалипал полчасика в интернеты, так намного лучше, ей богу. Особенно это касается Порнхаба и Двача. Когда читаешь описание категорий или срачи в /b/ — ощущение, что не деградируешь, а причащаешься к вечному.
Работает медленно, иногда может порушить вёрстку. Под капотом крутится google/gemini-2.5-flash-lite (кстати, если знаете модельку быстрее, не сильно дороже и не сильно тупее, посоветуйте пожалуйста).
Ещё чуть допилю и позже выложу, если вдруг кому пригодится.
Навайбкодил быстренько браузерное расширение, которое переводит тексты на сайтах в вот этот библейский стиль.
Позалипал полчасика в интернеты, так намного лучше, ей богу. Особенно это касается Порнхаба и Двача. Когда читаешь описание категорий или срачи в /b/ — ощущение, что не деградируешь, а причащаешься к вечному.
Работает медленно, иногда может порушить вёрстку. Под капотом крутится google/gemini-2.5-flash-lite (кстати, если знаете модельку быстрее, не сильно дороже и не сильно тупее, посоветуйте пожалуйста).
Ещё чуть допилю и позже выложу, если вдруг кому пригодится.
Тут исследователи из Пенсильванского университета решили по-взрослому проверить вот эту нашу промпт-инженерную магию. А именно, работает ли трюк "Веди себя как эксперт по...". Ну, т.е. когда вы просите нейронку притвориться профессором квантовой физики, чтобы она лучше ответила на ваш тупой вопрос.
Взяли шесть разных моделей (GPT-4o, GPT-4o-mini, o3-mini, o4-mini, Gemini 2.0 Flash, Gemini 2.5 Flash), навалили им сложнейших вопросов уровня аспирантуры по физике, химии, праву и т.д. и начали эксперимент.
Проверяли три подхода:
Эксперт в теме: просили модельку стать физиком для решения задач по физике.
Эксперт не в теме: просили стать физиком для решения задач по юриспруденции.
Тупой профан: давали роль обывателя, подростка или вообще ребёнка, который только учится ходить.
И знаете что?Это всё почти полная хуйня.
Когда нейронке давали роль эксперта в вопросе, её точность никак существенно не улучшалась. Вообще.
Когда эксперта просили отвечать не по своей теме, результаты иногда становились хуже. Gemini так вообще впадал в экзистенциальный кризис с тряской на повышенной амплитуде и часто отказывался отвечать, заявляя, что "не может с чистой совестью" давать ответ, так как не хватает экспертизы.
Ну а когда модельки просили стать ребенком — они послушно начинали нести дичь и стабильно показывали самые хреновые результаты.
Вывод: все популярные гайды, где советуют начинать промпт с назначения роли эксперта, по ходу, можно сливать в унитаз. Для изменения тона или стиля ответа это работает хорошо, но для повышения фактической точности на сложных задачах абсолютно бесполезно, а иногда даже вредно.
Железка умнее от ваших ролевых игр не становится.
тут подробнее
Взяли шесть разных моделей (GPT-4o, GPT-4o-mini, o3-mini, o4-mini, Gemini 2.0 Flash, Gemini 2.5 Flash), навалили им сложнейших вопросов уровня аспирантуры по физике, химии, праву и т.д. и начали эксперимент.
Проверяли три подхода:
Эксперт в теме: просили модельку стать физиком для решения задач по физике.
Эксперт не в теме: просили стать физиком для решения задач по юриспруденции.
Тупой профан: давали роль обывателя, подростка или вообще ребёнка, который только учится ходить.
И знаете что?
Когда нейронке давали роль эксперта в вопросе, её точность никак существенно не улучшалась. Вообще.
Когда эксперта просили отвечать не по своей теме, результаты иногда становились хуже. Gemini так вообще впадал в экзистенциальный кризис с тряской на повышенной амплитуде и часто отказывался отвечать, заявляя, что "не может с чистой совестью" давать ответ, так как не хватает экспертизы.
Ну а когда модельки просили стать ребенком — они послушно начинали нести дичь и стабильно показывали самые хреновые результаты.
Вывод: все популярные гайды, где советуют начинать промпт с назначения роли эксперта, по ходу, можно сливать в унитаз. Для изменения тона или стиля ответа это работает хорошо, но для повышения фактической точности на сложных задачах абсолютно бесполезно, а иногда даже вредно.
Железка умнее от ваших ролевых игр не становится.
тут подробнее
Ssrn
Prompting Science Report 4: Playing Pretend: Expert Personas Don't Improve Factual Accuracy
<span>
<p><span>This is the fourth in a series of short reports that help business, education, and policy leaders understand the technical details of working w
<p><span>This is the fourth in a series of short reports that help business, education, and policy leaders understand the technical details of working w