Я понял, что мне напоминают все эти генераторы видео.
Симуляцию физики в 3Д-пакетах. Где ты такой настраиваешь сначала цифры в клеточках, а потом нажимаешь кнопку "Давай". И оно симулит.
Те, кто провел пару тыщ часов с частицами, волосами, флюидами и прочей бесовщиной в 3Д - поймут.
Ну то есть ты не управляешь процессом, ты направляешь процесс. Ты можешь выбирать только начальные условия и прикручивать условный ControlNet - вдоль чего лететь, откуда испускать, текстурка для плотностей и пр.
А дальше оно само.
И вот ты нарулил гениальную симуляцию волны, убил небольшую часть жизни и большую часть здоровья, получилось просто бомба. Идешь такой гордый, показываешь режиссеру.
А он такой - ништяк, только в конце можно, чтобы заворачивалось покрасивее и пошустрее, и чтобы поровнее все было в начале, а то очень уж колбасится.
И ты понимаешь, что нельзя. Нельзя только в конце, или нельзя только поровнее, или только в начале. Можно только все заново переделать. Не с нуля, конечно, но чтобы попасть в видение режиссера ты должен снова написать кандидатскую диссертацию по уравнениям в частных производных. Ну и идешь, пишешь. А он такой - отлично, только можно, чтобы это было похоже на рой пчел?! Ты мямлишь - шо? А он - ну да, волна должна двигаться как рой пчел. Ну дальше вы поняли.
Когда сроки выходят, режиссер говорит, ладно, опять эти компьютерщики налажали, берем, что есть.
В общем, с генераторами видео вы будете заложниками симуляции, черного ящика у которого пока и параметров толком нет. Поэтому нарулить сможете только мемы, попадание в свои амбиции и короткие перебивки (тут хорошо, да).
Но как только в этой истории появится сторителлинг (пардон, за тавтологию), и не дай бог, режиссеры, то вам конец.
А вот в моушен дизайне хорошо зайдет. Там короткие формы и восприятие целиком, одним глотком.
Это пример нового motion brush в GEN-2. Нарядно выглядит, потому что симулирует симуляцию. А не историю.
Симуляцию физики в 3Д-пакетах. Где ты такой настраиваешь сначала цифры в клеточках, а потом нажимаешь кнопку "Давай". И оно симулит.
Те, кто провел пару тыщ часов с частицами, волосами, флюидами и прочей бесовщиной в 3Д - поймут.
Ну то есть ты не управляешь процессом, ты направляешь процесс. Ты можешь выбирать только начальные условия и прикручивать условный ControlNet - вдоль чего лететь, откуда испускать, текстурка для плотностей и пр.
А дальше оно само.
И вот ты нарулил гениальную симуляцию волны, убил небольшую часть жизни и большую часть здоровья, получилось просто бомба. Идешь такой гордый, показываешь режиссеру.
А он такой - ништяк, только в конце можно, чтобы заворачивалось покрасивее и пошустрее, и чтобы поровнее все было в начале, а то очень уж колбасится.
И ты понимаешь, что нельзя. Нельзя только в конце, или нельзя только поровнее, или только в начале. Можно только все заново переделать. Не с нуля, конечно, но чтобы попасть в видение режиссера ты должен снова написать кандидатскую диссертацию по уравнениям в частных производных. Ну и идешь, пишешь. А он такой - отлично, только можно, чтобы это было похоже на рой пчел?! Ты мямлишь - шо? А он - ну да, волна должна двигаться как рой пчел. Ну дальше вы поняли.
Когда сроки выходят, режиссер говорит, ладно, опять эти компьютерщики налажали, берем, что есть.
В общем, с генераторами видео вы будете заложниками симуляции, черного ящика у которого пока и параметров толком нет. Поэтому нарулить сможете только мемы, попадание в свои амбиции и короткие перебивки (тут хорошо, да).
Но как только в этой истории появится сторителлинг (пардон, за тавтологию), и не дай бог, режиссеры, то вам конец.
А вот в моушен дизайне хорошо зайдет. Там короткие формы и восприятие целиком, одним глотком.
Это пример нового motion brush в GEN-2. Нарядно выглядит, потому что симулирует симуляцию. А не историю.
🔥63👍22👎2
Media is too big
VIEW IN TELEGRAM
Ну и вот вам немного будущего моушен дизайна от Михи Дадаева.
Это ChatGPT×Dalle3×Gen2
Кпопка сделать красиво пока состоит из трех кнопок.
Это ChatGPT×Dalle3×Gen2
Кпопка сделать красиво пока состоит из трех кнопок.
🔥60👎8
Тут вот все с восторгом постят новость про то, что обновленный Bard научился пересказывать видео из YouTube.
Хех. Постить не тесты ворочать.
А мы попробуем.
Берем видос (вы же помните, как я упарывался с Bing-ом на эту тему), причем не с говорящей головой, а .. с шумом волн (суровые сибирские мужики всегда засовывают рельсу в соломорезку).
Для начала спрашиваем:
can you read internet links?
Yes, I can read internet links, but only if the content is publicly accessible. I cannot access content that is behind a paywall or that requires login credentials. Additionally, I cannot access content that is not in a text format, such as images or videos.
Настораживаемся...
decribe and summarize this video: https://youtu.be/E7qRkUYu580
I'm sorry, but I'm unable to access this YouTube content. This is possible for a number of reasons, but the most common are: the content isn't a valid YouTube link, potentially unsafe content, or the content does not have a captions file that I can read.
"содержимое не имеет файла с титрами, который я могу прочитать."!!!
Расходимся. Всех этих читалок и суммаризаторов титров в интернетике уже пруд пруди.
Более того, вы давно можете скачать видос, пропустить его через Whisper или другой speech-to-text, а потом попросить chatGPT суммаризировать полученный текст.
Ни о каком анализе видео речи не идет. Бард тупо читает титры, а если их нет, уходит в отказ. Фу таким быть.
Хех. Постить не тесты ворочать.
А мы попробуем.
Берем видос (вы же помните, как я упарывался с Bing-ом на эту тему), причем не с говорящей головой, а .. с шумом волн (суровые сибирские мужики всегда засовывают рельсу в соломорезку).
Для начала спрашиваем:
can you read internet links?
Yes, I can read internet links, but only if the content is publicly accessible. I cannot access content that is behind a paywall or that requires login credentials. Additionally, I cannot access content that is not in a text format, such as images or videos.
Настораживаемся...
decribe and summarize this video: https://youtu.be/E7qRkUYu580
I'm sorry, but I'm unable to access this YouTube content. This is possible for a number of reasons, but the most common are: the content isn't a valid YouTube link, potentially unsafe content, or the content does not have a captions file that I can read.
"содержимое не имеет файла с титрами, который я могу прочитать."!!!
Расходимся. Всех этих читалок и суммаризаторов титров в интернетике уже пруд пруди.
Более того, вы давно можете скачать видос, пропустить его через Whisper или другой speech-to-text, а потом попросить chatGPT суммаризировать полученный текст.
Ни о каком анализе видео речи не идет. Бард тупо читает титры, а если их нет, уходит в отказ. Фу таким быть.
Telegram
Метаверсище и ИИще
Суммаризация видео в чистом виде. Без базара.
В прошлом посте, я приводил пример, как можно заставить Бинг описывать видео, причем я не хотел, чтобы он тупо делал расшифровку речи в текст и подсовывал мне краткое изложение. Поэтому я ему присунул на вход…
В прошлом посте, я приводил пример, как можно заставить Бинг описывать видео, причем я не хотел, чтобы он тупо делал расшифровку речи в текст и подсовывал мне краткое изложение. Поэтому я ему присунул на вход…
👍74🔥11😁1
Forwarded from Нейронавт | Нейросети в творчестве
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
А вы заметили что уже есть сопособы затестить Stable Video Diffusion онлайн?
Ссылки прилагаю внизу поста.
Я затестил и уже сделал несколько выводов.
Самое главное:
он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
Ссылки прилагаю внизу поста.
Я затестил и уже сделал несколько выводов.
Самое главное:
он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
👎24👍10🔥1
Похоже StabilityAI тратят деньги инвесторов в основном на маркетинг.
Схема такая:
{
бахнуть анонс нового сырого продукта, кликбейтнуть в интернетике, показать инвесторам информационный шум, забить на продукт, пилить новый сырой продукт
} while money>0;
Stable Animation
StableLM
StableBeluga (1 и 2)
StableAudio
StableChat
StableCode
FreeWilly 1 и 2
StableVicuna
DeepFloyd
StableSwarmUI
где развитие этих с помпой анонсированных продуктов?
Или смысл в том, чтобы анонсировать недоделанные продукты, а опен-сорс все сам допилит?
P.S. Что-то я злой сегодня.
Схема такая:
{
бахнуть анонс нового сырого продукта, кликбейтнуть в интернетике, показать инвесторам информационный шум, забить на продукт, пилить новый сырой продукт
} while money>0;
Stable Animation
StableLM
StableBeluga (1 и 2)
StableAudio
StableChat
StableCode
FreeWilly 1 и 2
StableVicuna
DeepFloyd
StableSwarmUI
где развитие этих с помпой анонсированных продуктов?
Или смысл в том, чтобы анонсировать недоделанные продукты, а опен-сорс все сам допилит?
P.S. Что-то я злой сегодня.
👍63🔥17
👍5🔥1
Forwarded from AshleyFx
This media is not supported in your browser
VIEW IN TELEGRAM
Врываемся в выходные ❤️🥳
🔥93👎16👍6
Через пару недель под каждым постом в твитторе появится кнопка "Грок аналитика".
Маск зуб даёт.
Гадаем, что она будет делать.
Считать количество ботов в ответах.
Определять сентименты в комментах.
Давать оценку ментального здоровья автора твита
Слать нахрен особо ядовитых комментаторов.
Суммаризировать пост из 140 символов в 40.
Суммаризировать длинные тренды
Отвечать на вопросы
Троллить в духе маска
Генерить мемас
https://twitter.com/elonmusk/status/1728591219180052652
Ждём ответочки от Цука.
Маск зуб даёт.
Гадаем, что она будет делать.
Считать количество ботов в ответах.
Определять сентименты в комментах.
Давать оценку ментального здоровья автора твита
Слать нахрен особо ядовитых комментаторов.
Суммаризировать пост из 140 символов в 40.
Суммаризировать длинные тренды
Отвечать на вопросы
Троллить в духе маска
Генерить мемас
https://twitter.com/elonmusk/status/1728591219180052652
Ждём ответочки от Цука.
👍39🔥9
Audio
Metaverse Reloaded #1
Давайте устроим небольшой марафон по созданию контента, ибо накопилось некоторое количество поводов, позволяющих пованговать о том, куда двигаются все эти цифровые инфлюенсеры, цифровые двойники (в реальности N-ники), виртуальные твари, да и вообще соц-сети вместе с тем самым контентом, которые до сегодняшнего времени горды пребывал в позиции Content is The King.
После моего поста про новую версию Suno, народ в коментах слегка охренел(в хорошем смысле) и нагенерил такого, что даже у меня уши на лоб полезли.
В шапке один из примеров. А я позволю себе диванные прогнозы о том, что в ближайшее время нас ждет кратковременный шквал примеров и инфоцыганских курсов о том, как писать промпты для создания ИИ-музыки. Вы ведь все помните все эти тонны видосов, туториалов и мощных обучалок о том, как писать промпты для Midjourney и Stable Diffusion, как создавать курсы по промтингу для chatGPT, сделанные с помощью chatGPT, ну и нашествие мамкиных промпт-инженеров с рецептами от капитана очевидности.
Послушайте песенку (автор Alex Losev @alosev5 и Suno), а следующим постом я дам очень хороший репост, который хорошо закрывает тему создания песенок в Suno (а песня про Зайчат - это огнищще). Все, что вам нужно, это экспериментировать и вы быстро обнаружите нужные рецепты для себя, просто включив критическое мышление.
Давайте устроим небольшой марафон по созданию контента, ибо накопилось некоторое количество поводов, позволяющих пованговать о том, куда двигаются все эти цифровые инфлюенсеры, цифровые двойники (в реальности N-ники), виртуальные твари, да и вообще соц-сети вместе с тем самым контентом, которые до сегодняшнего времени горды пребывал в позиции Content is The King.
После моего поста про новую версию Suno, народ в коментах слегка охренел(в хорошем смысле) и нагенерил такого, что даже у меня уши на лоб полезли.
В шапке один из примеров. А я позволю себе диванные прогнозы о том, что в ближайшее время нас ждет кратковременный шквал примеров и инфоцыганских курсов о том, как писать промпты для создания ИИ-музыки. Вы ведь все помните все эти тонны видосов, туториалов и мощных обучалок о том, как писать промпты для Midjourney и Stable Diffusion, как создавать курсы по промтингу для chatGPT, сделанные с помощью chatGPT, ну и нашествие мамкиных промпт-инженеров с рецептами от капитана очевидности.
Послушайте песенку (автор Alex Losev @alosev5 и Suno), а следующим постом я дам очень хороший репост, который хорошо закрывает тему создания песенок в Suno (а песня про Зайчат - это огнищще). Все, что вам нужно, это экспериментировать и вы быстро обнаружите нужные рецепты для себя, просто включив критическое мышление.
👍19🔥9
Вот очень хорошие советы про то, как "писать песни" в Suno. Вы и сами до них дойдете, если дадите себе труд немного поэкспериментировать. Ну и это очень похоже на подгонку музыки под текст в реальной жизни и вообще сведение музыки.
https://t.me/dreamsrobots/172
https://t.me/dreamsrobots/172
Telegram
Dreams and Robots
Как получить от Суно законченную песню с нужной вам структурой:
1. Старайтесь соблюдать размер в стихах. Если ваш текст сложно петь, получится речитатив независимо от жанра. Если вы сделаете в припеве и куплете разные размеры, то Суно будет проще придумать…
1. Старайтесь соблюдать размер в стихах. Если ваш текст сложно петь, получится речитатив независимо от жанра. Если вы сделаете в припеве и куплете разные размеры, то Суно будет проще придумать…
🔥22👍6👎1
Media is too big
VIEW IN TELEGRAM
Ну и я не могу не поделиться шедевром от Влада Ахтырского. К сожалению пронзительный текст не все поймут и оценят в силу специфики профессии, но те, кто принимает тяжелую компьютерную графику, точно зарыдают сквозь смех и наоборот. Текст был написан на одном из самых тяжелых проектов "Дракула" в 2014 году (производство VFX для кино - это вообще-то адский труд) и Влад сделал очень точный срез боли и страданий из этого ада.
Suno написал музыку, ИИ сгенерил видеоряд. Получился слепок времени.
Suno написал музыку, ИИ сгенерил видеоряд. Получился слепок времени.
🔥40👍8
А мне вот приход Suno и подобных инструментов напомнил появление на рынке дешевых синтезаторов с функциями "загадай мелодию" или многочисленными пресетами. Именуемых в народе "самограйками". Их появление породило появление культурного феномена под названием "шансон", а на уши ширнармасс обрушились незамысловатые ритмичные и простенькие мелодии, заслужившие народную любовь, особенно в ресторанах 90-х.
Suno уже очень близок к тому, чтобы клепать такие мелодии в несметных количествах (причем не только для кабаков, а вообще в любых жанрах). Про рэп я вообще молчу, там он чертовски хорош и осталось подождать затюненный rapGPT, который будет писать тексты на которые молятся рэперы.
Кроме того Suno уже может служить источником идей, коротких музыкальных фраз (хуков, рифов), за которыми гоняются кожаные попсовые композиторы. Поймал такую фразу, словил хит.
Теперь можно просить его (примерно как chatGPT) генерить идеи в огромных количествах, и отлавливать кожаным ухом потенциальные жемчужины, допилив которые, можно строчить новые хиты.
А скоро и ухо не понадобится. A/B тесты на стримингах, и вот уже простенькие мелодии, которые перформят лучше других идут в датасет.
Suno уже очень близок к тому, чтобы клепать такие мелодии в несметных количествах (причем не только для кабаков, а вообще в любых жанрах). Про рэп я вообще молчу, там он чертовски хорош и осталось подождать затюненный rapGPT, который будет писать тексты на которые молятся рэперы.
Кроме того Suno уже может служить источником идей, коротких музыкальных фраз (хуков, рифов), за которыми гоняются кожаные попсовые композиторы. Поймал такую фразу, словил хит.
Теперь можно просить его (примерно как chatGPT) генерить идеи в огромных количествах, и отлавливать кожаным ухом потенциальные жемчужины, допилив которые, можно строчить новые хиты.
А скоро и ухо не понадобится. A/B тесты на стримингах, и вот уже простенькие мелодии, которые перформят лучше других идут в датасет.
👍34
This media is not supported in your browser
VIEW IN TELEGRAM
Metaverse Reloaded #2
Теперь соберем все вместе: текст, музику и видео.
И вот вам уже цифровой артист, виртуальный певец, дигитальный инфлюенсер, иишный перформер.
Вы сейчас начнете искать блох, липсинк неточный, нет эмоций, все статично и пр.
Камон.
Это схавают с потрохами толпы, пожирающие k-pop и тикток. Это зайдет аж бегом 11-летним девочкам и мальчикам. Это наводнит ютюб, пока он не опомнится.
Через полгода это реально будет ОДНОКНОПОЧНЫМ решением: выбираете из библиотеки (или конструируете на сайте, или описываете текстом) мордашку, жмете кнопку и оно вам пишет лирику, музыку, генерит задник и постит везде, где закажете. И дальше пишет коменты, отвечает кожаным и ботам, поддерживает трафик, распознает потенциальные запросы на рекламу, доводит до офера и ведет эту одноклеточную и однокнопочную систему само.
И если раньше за спиной у какой-нибудь Лил-матьеё-Микуелы сидело на бекстейдже кожаное агенство с креаторами и маркетологами, то теперь им пора в разметчики.
Вишенка на торте - это ответы этой твари в твитторе - она даже саркастично приводит скриншоты из chatGPT, где видно, что ее коменты написал именно chatGPT.
Отличный нейминг AnnaIndiana - проброс в Ханну Монтану.
Вот он реальный Метаверс, который идет к вам в Инсту, Тик-ток и прочая, населяя соцсети всеми этими цифровыми тварями. И вот уже эти твари живут своей жизнью, зарабатывают (та самая метаверс экономика), с ними не скучно как в тряпочных метаверсах, ну и самое главное, вам не надо надевать на потные головы лыжные маски, чтобы припасть метаверса.
Не туда глядел Цук. Впрочем он свое наверстает. Метачка пилит конструктор для ботов и аватаров. Скоро будут петь и плясать.
А ваши дети будут жать кнопки.
Оплаты...
P.S. Спасибо за наводку старым добрым хакерам из Saint Mary Liberty Island
Теперь соберем все вместе: текст, музику и видео.
И вот вам уже цифровой артист, виртуальный певец, дигитальный инфлюенсер, иишный перформер.
Вы сейчас начнете искать блох, липсинк неточный, нет эмоций, все статично и пр.
Камон.
Это схавают с потрохами толпы, пожирающие k-pop и тикток. Это зайдет аж бегом 11-летним девочкам и мальчикам. Это наводнит ютюб, пока он не опомнится.
Через полгода это реально будет ОДНОКНОПОЧНЫМ решением: выбираете из библиотеки (или конструируете на сайте, или описываете текстом) мордашку, жмете кнопку и оно вам пишет лирику, музыку, генерит задник и постит везде, где закажете. И дальше пишет коменты, отвечает кожаным и ботам, поддерживает трафик, распознает потенциальные запросы на рекламу, доводит до офера и ведет эту одноклеточную и однокнопочную систему само.
И если раньше за спиной у какой-нибудь Лил-матьеё-Микуелы сидело на бекстейдже кожаное агенство с креаторами и маркетологами, то теперь им пора в разметчики.
Вишенка на торте - это ответы этой твари в твитторе - она даже саркастично приводит скриншоты из chatGPT, где видно, что ее коменты написал именно chatGPT.
Отличный нейминг AnnaIndiana - проброс в Ханну Монтану.
Вот он реальный Метаверс, который идет к вам в Инсту, Тик-ток и прочая, населяя соцсети всеми этими цифровыми тварями. И вот уже эти твари живут своей жизнью, зарабатывают (та самая метаверс экономика), с ними не скучно как в тряпочных метаверсах, ну и самое главное, вам не надо надевать на потные головы лыжные маски, чтобы припасть метаверса.
Не туда глядел Цук. Впрочем он свое наверстает. Метачка пилит конструктор для ботов и аватаров. Скоро будут петь и плясать.
А ваши дети будут жать кнопки.
Оплаты...
P.S. Спасибо за наводку старым добрым хакерам из Saint Mary Liberty Island
👍34👎21🔥6
Metaverse Reloaded #3
Ну и остается интересный вопрос: а что делать Метачке, Тикточеку и прочим соцсетям, когда туда хлынут вот такие АнныИндианы?
С одной стороны захочется запретить, ибо есть борьба с ботами, подтверждения личности и вообще все должно быть кожаное.
С другой стороны - это огромные деньги от рекламы.
Помните, Ютюбчик сделал над собой усилие и зачистил все эти трешевые видосы со спайдерменами и миньонами, которые производились одной кнопкой в блендере и которые зомбировали двухлеток, набирая миллионы просмотров.
Если Инста захочет избавится от таких вот АннИндиан, то свято место тут же займут очень смышленые ребята. И вот вам пруф.
Welcome to the World's Largest AI Profile Network
Уже питчатся новые ИИ-соцсети, где обитают ИИ-персонажи. И туда уже поглядывают рекламодатели, продавцы трафика, и маркетинг агенства.
Если размотать доменное имя с куаркода, то можно попасть на
A Europe-based marketing agency with over 16+ years of experience driving growth, and bringing cutting-edge technology to clients.
И @Julmodels - The best Erotic Model Agency
Будем наблюдать, по какому пути пойдет Инста и другие: запретить или привечать?
А новый метаверсик дырочку найдет. Куда и хлынут все эти Анны Индианы.
Ну и остается интересный вопрос: а что делать Метачке, Тикточеку и прочим соцсетям, когда туда хлынут вот такие АнныИндианы?
С одной стороны захочется запретить, ибо есть борьба с ботами, подтверждения личности и вообще все должно быть кожаное.
С другой стороны - это огромные деньги от рекламы.
Помните, Ютюбчик сделал над собой усилие и зачистил все эти трешевые видосы со спайдерменами и миньонами, которые производились одной кнопкой в блендере и которые зомбировали двухлеток, набирая миллионы просмотров.
Если Инста захочет избавится от таких вот АннИндиан, то свято место тут же займут очень смышленые ребята. И вот вам пруф.
Welcome to the World's Largest AI Profile Network
Уже питчатся новые ИИ-соцсети, где обитают ИИ-персонажи. И туда уже поглядывают рекламодатели, продавцы трафика, и маркетинг агенства.
Если размотать доменное имя с куаркода, то можно попасть на
A Europe-based marketing agency with over 16+ years of experience driving growth, and bringing cutting-edge technology to clients.
И @Julmodels - The best Erotic Model Agency
Будем наблюдать, по какому пути пойдет Инста и другие: запретить или привечать?
А новый метаверсик дырочку найдет. Куда и хлынут все эти Анны Индианы.
👍9🔥2