сбежавшая нейросеть

Учимся писать промпты для Sora 2

OpenAI выпустили классное руководство по промптингу Sora 2, а я подготовил выжимку самого полезного. О том, как попасть в “Сору”, писал здесь, в этом же посте делился и впечатлениями — правда, с тех пор сильно ужесточили контроль за авторским правами, поэтому ремейки “Южного парка” сделать больше не выйдет.

Но хватит грустить, начнем с максимального варианта промпта, который советуют в OpenAI.

[Описываем сцену простым языком: персонажей, костюмы, окружение, погоду и другие детали. Добавляйте столько подробностей, чтобы получить видео, максимально соответствующее замыслу.]

Камера: [варианты будут дальше]

Линза: [24–28 мм (широкоугольная) / 35 мм (естественная перспектива) / 50 мм (нейтрально-портретная) / 85 мм (портретная, сильнее размывает фон) / 135 мм+ (дальняя, сжатие планов)]

Свет: [ключевой (основной) / заполняющий / контровой (обводящий) / практический источник (лампа/вывеска в кадре) / свет из окна (дневной) / неон (бирюза/пурпур) / «золотой час» (контровой закат + лёгкая дымка) / рассеянный пасмурный]

Настроение: [общий тон, например: кинематографично и напряженно; игриво и с налетом саспенса]

Действия:
— [первое важное событие/реплика в видео]
— [второе важное событие/реплика в видео]
— [количество действий не ограничено, но учитывайте 10-секундную длительность видео]

Диалоги:
[Если в ролике есть реплики, добавьте их сюда или в раздел «Действия». Опять же, не забывайте про 10-секундную длительность.]

Вот отдельные варианты для камеры, собираем из каждого пункта:

План: суперобщий (экстремально общий) / общий / средний / американский (по колено) / погрудный / крупный / деталь (экстремальный крупный)

Ракурс: на уровне глаз / нижний / верхний / три четверти / профиль / фронтально / план через плечо (OTS) / POV (точка зрения героя)

Движение: статично / наезд / отъезд / горизонтальная панорама / вертикальная панорама / трэвеллинг (следование) / облет по дуге / стедикам / кран / джиб / дрон / таймлапс / замедление

Фокус/приемы: перевод фокуса (rack focus) / ГРИП: мелкая / средняя / глубокая / сплит-диоптр / «рыбий глаз»

Вообще в OpenAI делают отдельный упор на креативность Sora 2: если где-то не дать модели инструкций, то она придумает сама. Поэтому из промпта выше можно удалять целые блоки — модель сама подберет вариант, который считает правильным.

Но есть и обратная сторона — Sora 2 часто перегибает с креативом. Например, если в промпте вообще ничего не сказать об озвучке, то часто модель может сама сочинить короткий диалог. Поэтому не забывайте прописывать в промпте не только то, что хотите увидеть в видео, но и что не хотите видеть — так и напишите, что “без диалогов”.

Вообще в OpenAI советуют не ждать хорошего результата с первой попытки, а экспериментировать: Sora 2 позволяет бесплатно создавать несколько десятков видео в сутки (лимиты постоянно меняются), причем генерирует их сравнительно быстро. Поэтому я, например, начинаю с минимального промпта — и если результат мне не нравится, то добавляю деталей. А иногда, наоборот, можно вкинуть что-нибудь типа “Короткий трейлер “Войны и мира”, но действие происходит в наше время” — и посмотреть, чего напридумывает Sora 2.

Когда ролик близок к тому, что вам хотелось — попробуйте довести его до ума с помощью функции Remixes (для этого видео надо опубликовать, а затем нажать на маленькую круглую иконку под описанием — я сам долго искал). Здесь OpenAI настоятельно рекомендуют отойти от массивных промптов и вносить по одной правке за раз: например, добавить еще одного монстра, поменять цвет костюма главного героя и так далее.

Ну и совет — не ждите от генерации 100% попадания в промпт. Даже у чат-ботов это получается не всегда, ну а модели генерации видео еще очень молодые — и пройдет какое-то время, пока они научатся четко исполнять все желания пользователя. Воспринимайте их ошибки как элементы ИИ-креативности — и удовольствие от результата будет получать проще!

#сбежавшая_нейросеть_промпты

👍48❤22🔥15👏1

7.05K viewsedited 18:58

сбежавшая нейросеть

Пузырь, и что после него останется

В сети уже пару дней обсуждают инфографику Bloomberg о том, как устроена ИИ-индустрия. Симптомы тревожные:

— OpenAI после вторичной продажи акций сотрудников подорожала до $500 млрд. Буквально весной компания стоила $300 млрд.
— Nvidia договорилась вложить в OpenAI $100 млрд, на которые та купит ускорители и инфраструктуру для дата-центров у, опять же, Nvidia.
— Параллельно OpenAI покупает ускорители у AMD (говорят о десятках миллиардов), строит с Oracle и Softbank дата-центры Stargate (от $500 млрд - но сюда входит и сделка с Nvidia), а на сдачу разрабатывает собственный ИИ-ускоритель (что-то в районе $10 млрд).
— Nvidia же вкладывается в xAI: сумма не называется, но Хуанг жалеет, что вложил мало.
— А еще много сделок с игроками поменьше и отдельный ИИ-бум на фондовом рынке Китая.

Если вы слышите странный звук, то, возможно, это надувается пузырь. Кстати, про пузырь говорят и многие игроки ИИ-рынка: бывший глава Amazon Джеф Безос и сам Сэм Альтман.

Мы воспринимаем пузыри на фондовом рынке и в экономике как что-то плохое, но история знает совершенно разные примеры.

Первый — крах Компании Южных морей в Великобритании в 1720 году. Корона тогда была в долгах из-за войн — и менеджмент компании предложил выкупить их часть в обмен на монопольное право торговать с Южной Америкой. Получив согласие, директора компании очень грамотно распространили слухи о богатстве Южных морей, подкупив многих влиятельных политиков.

Весной 1720 года акции компании начали стремительно расти в цене — их покупали все, от аристократов до простых горожан. К лету цена достигла 1050 фунтов — а потом пузырь вскрылся. Доходы от торговли были ничтожны, а имущество составляло лишь офис и небольшой флот. К осени акции упали до 150 фунтов, разорив огромное количество англичан — состояние потерял даже Исаак Ньютон. Власти провели расследование, пересажали кучу народа, компанию арестовали, а страна вышла из кризиса лишь проведя очень жесткие реформы фондового рынка.

В 1840 году Великобританию охватил очередной бум — вся страна бросилась строить железные дороги. В “технологию века” охотно вкладывались банкиры и частники, цифры в прогнозах писались совершенно оторванными от реальности, а многие проекты запускали по принципу “все строят — и мы будем!”

Бахнуло не менее знатно чем в первый раз: куча людей потеряла состояние, а многие проекты так и не завершили. Но все-таки у этого пузыря есть одно отличие — из кризиса Великобритания вышла с одной из лучших сетей железных дорог на то время.

Текущая ситуация на ИИ-рынке если и приведет к пузырю, то он будет напоминать именно железнодорожный. Инвесторов можно сколько угодно критиковать, но их вложения — это вера в “технологию века”, инфраструктуру, которая останется с нами навсегда.

И это подтверждается: только у продуктов OpenAI 800 млн пользователей еженедельно. Дальше количество будет расти, а потребности — увеличиваться с появлением ИИ-агентов, роботов и моделей для генерации долгих видео и виртуальных миров. Поэтому вложения в ИИ идут опережающими темпами — все торопятся застолбить место на рынке.

Проблема — пока мало кто знает, как монетизировать ИИ. Доходов с продажи подписок и доступа по API, очевидно, будет мало. Кроме того, огромный процент пользователей сидит на бесплатных тарифах. Зарабатывать на них надо рекламой — но я пока не видел ни одной реально прописанной модели.

Наконец, никто не понимает, как развертывание ИИ глобально изменит экономику. Можно оценить эффект от внедрения ИИ в компаниях (он пока умеренный), но трудно даже примерно сказать, как он влияет на производительность миллионов сотрудников, которые втихую покупают подписку на ChatGPT и используют для работы.

Чем все это закончится — не знают, пожалуй, даже лучшие прогнозисты в мире. Но в одном можно быть уверенными на 100%: ИИ как технология останется с нами навсегда. И лучший способ уберечь себя от потрясений — постоянно учиться ее использовать.

2👍83❤30🔥5🥰2👏1

6.9K views18:00

сбежавшая нейросеть

И все-таки не стоит грубить ChatGPT

Несколько дней в X и в некоторых русскоязычных ТГ-каналах) разгоняют исследование “Следите за тоном: как вежливость формулировки промпта влияет на точность больших языковых моделей” от Ома Добарии и Ахила Кумара из Пенсильванского университета. Вывод — грубые запросы к ChatGPT якобы повышают точность ответов ИИ.

Постоянные читатели канала знают, что я противник “трюков” в промптах — всех этих назначений роли 20-летнего суперспециалиста и угроз “отвечай лучше или удалю!”. Хороший промпт — тот, где вы четко даете ИИ задачу, нужный контекст, формат ответа и ограничения. Поэтому исследование особенно заинтересовало меня — вдруг надо делать иначе?

Короткий ответ: нет, не надо.

К научным исследованиям принято относиться с особым уважением: все-таки люди пишут не на базе субъективного опыта, а проектируют эксперимент, анализируют результаты и потом приходят к выводам. Но в реальности исследований публикуется огромное количество, они заметно отличаются по качеству, а порой и в действительно сильных работах находят ошибки через десятки лет.

Работа Добарии и Кумара и вовсе носит статус препринта — фактически, черновика, который проходит независимое рецензирование, а затем уходит на доработку или принимается научным журналом. Брать такое на вооружение — неправильно, что, кстати, признают даже авторы.

Но посмотрим в деталях. Авторы придумали 50 вопросов и переписали каждый в пяти вариантах, от очень вежливого до очень грубого, а затем… вернее, ничего они не придумали, а просто попросили ChatGPT Deep Research нагенерить вопросы и ответы на них.

Deep Research работает на базе GPT o3, которая склонна галлюцинировать. Уже здесь угроза, что в исследование могли попасть ошибки — но ни о какой ручной проверке я упоминаний не нашел. На каждый промпт ИИ предлагалось выбрать один из вариантов ответа: A, B, C, D. Скажите, вы часто задаете ИИ подобные вопросы? Лично я — нет.

Дальше — веселее. Вопросы задали ровно одной модели — ChatGPT-4o — что также ни в какие ворота. Во-первых, модель устарела. Во-вторых, она обучалась на похожем датасете, что и GPT o3 — это может исказить качество ответов. В-третьих, все ИИ отвечают по-разному — и в нормальное исследование стоило добавить конкурирующие продукты.

Косяки работы можно разбирать еще долго. В одном из вопросов грубой формулировкой почему-то считается просьба “сфокусироваться”. Многие детали эксперимента — например, как задавали вопросы — практически не описываются. Вообще не посчитан доверительный интервал — а ведь это база статистики.

Но, пожалуй, хватит. В конце я приведу ссылки на два своих старых поста, где объясняю, почему не стоит использовать трюки, а часто и роли (кстати, со ссылками на действительно серьезные исследования). Пока же немного чистой логики. Представьте, что вы дали модели простой промпт по классической схеме:

— (роль строго когда надо — например, “оцени идею как потенциальный клиент”)
— описание задачи
— желаемый формат ответа
— ограничения (что не надо делать)
— контекст (информация, нужная для решения задачи)

ИИ дал ответ, качество вас не устроило. В таком случае разобраться, что пошло не так, будет достаточно просто: возможно, недостаточно точно сформулирована задача, не дан нужный контекст (или дан лишний), формат ответа слишком короткий. Добавляем нужное в промпт — и, экспериментируя, получаем хороший вариант.

Но чем больше вы докидываете в промпт мотивирующего мусора, пояснений, как именно надо делать задачу, детального описания роли, умений и даже личных качеств ИИ-специалиста — тем сложнее понять, что именно повлияло на качество ответа. Плохая формулировка задачи? Или взаимоисключающие инструкции?

В следующий раз дам пару советов, которые действительно могут повысить эффективность ответов ИИ — постараюсь уже завтра, если не будет крупных новостей (Google явно что-то замышляет). А пока, как и обещал, ссылки на старые посты:

Как правильно задавать роли в промптах
Работают ли трюки в промптах

3❤40👍34🔥14👏3

5.11K viewsedited 18:00

сбежавшая нейросеть

ChatGPT, давай заново!

Вчера я вновь рассказывал, почему вы вряд ли добьетесь лучшего ответа от ИИ с помощью ухищрений вроде грубости и шантажа. Но что же реально работает? Делюсь приемами, которыми пользуюсь каждый день.

Позвольте ИИ задать вопросы

Хороший специалист, получив задачу, задаст по ней вопросы. На то он и профи, что отлично знает свою работу и может подсветить неочевидные моменты.

Современные чат-боты пока лишены такой роскоши. Как написано в промпте — так и делаем. Хорошо, если пользователь, получив неудачный результат, разберется, что пошло не так, уточнит задачу, пояснит контекст — и добьется нормального ответа.

Но есть способ проще — добавляем в конец промпта:

Не отвечай сразу, а задай мне вопросы, ответы на которые помогут тебе дать лучший результат. Отсортируй вопросы по важности. Получив мои ответы – напиши свой.

Я использую такой прием в сложных задачах — как бы внимательно ни прописывал стартовый промпт, нейронка находит минимум несколько важных вещей, которые я упустил.

Кстати, если решение затянулось на диалог из десятка запросов, то полезно делать паузы с помощью похожего промпта:

Проанализируй беседу. Мы что-то упускаем? Тебе нужна от меня дополнительная информация для лучшего решения задачи?

Оценка ответа

Поскольку ИИ мы запускаем на компьютере/смартфоне, то воспринимаем его как программу. А классическим программам свойственна хирургическая точность — если в Excel пять раз вбить одни цифры и формулы, то ответ всегда будет одинаковым.

Но ИИ не совсем программа, а вероятностная модель, которая опирается на статистику и случайность. Если дать один и тот же промпт пять раз подряд — то каждый ответ будет немного отличаться по стилю, а порой и качеству.

Во многих популярных бенчмарках каждую задачу прогоняют несколько раз, чтобы убедиться, не способен ли ИИ вообще ее решить или решает без уверенности. Никто не мешает делать так же: не нравится ответ – прогоните еще раз с минимальной доработкой промпта или без нее.

Есть другой вариант, мне он нравится больше. Получив ответ, пишем:

Оцени свой последний ответ: проверь фактику, напиши, что получилось хорошо, а что можно сделать лучше. Предложи список доработок.

Простой промпт, который решает несколько задач — вылавливает галлюцинации (не все — про ручную проверку не забывайте!), а также находит, что улучшить. Оценивайте предложенные варианты, выбирайте, что нравится — и просите доработать с их учетом.

(во многих версиях этого промпта рекомендуют, чтобы ИИ выставил сам себе оценку от 1 до 10. Я этой ерундой не маюсь, так как нейронки обычно лепят “восьмерку”)

Gemini, проверь!

Простой и логичный совет: выберите себе основную нейронку, возможности которой вы будете знать от и до, а параллельно играйтесь с другими моделями (можно выбрать из списка бесплатных). Так вы лучше будете разбираться в возможностях разных ИИ, а также сможете выжать из них больше.

Например, я люблю GPT-5 Thinking за глубокие и четкие рассуждения. Проверить статью на фактику и логику, дать прогноз, поискать интересное в аналитике — все это к ней. Но минус модели в том, что она специфично пишет на русском: с кучей списков, профессиональных терминов и англицизмов. Иногда помогает просьба “перепиши ответ как будто объясняешь неспециалисту”, а если не работает — берем Gemini 2.5 (хватит Flash) и просим переписать.

Плюс в последнее время у меня в паре с GPT-5 открыт Grok 4 — и когда задача выглядит сложной или новой, то я просто копирую промпт, чтобы получить два ответа. Затем сравниваю сам или беру ответ Грока и кидаю в GPT-5:

Оцени ответ другого ИИ: проверь фактику, затем выдели информацию, которая поможет усилить твой ответ (если такая есть), и напиши финальную версию.

Как альтернатива — можете генерировать ответ только в одной нейронке, а другую просить проверить по промпту из главы выше.

P.S. Написал текст и закинул его в GPT-5 + Grok 4 с просьбой поштормить еще идей. Получил под 30 новых вариантов: проверю, если что-то понравится — расскажу!

#сбежавшая_нейросеть_промпты

3👍76🔥29❤24👏3

6.37K viewsedited 15:44

сбежавшая нейросеть