А прикольно, что мы менее чем за год перескочили с просмотров в нашей ленте 5,8-секундных немых роликов к фильмам на несколько минут с первоклассным саунд-дизайном.
Forwarded from с нуля до 1%
Сегодня 24 февраля. Обещанного официального API от Сиданс всё ещё нет.
Но рынок не ждёт. Я разобрал проекты, которые уже перепродают доступ к модели.
Собрал ключевые цифры в таблицу выше. Разброс цен и условий получается интересным.
💎 Mitte.ai — это премиум-вход за $129.
Дорого, зато без очередей. Отличный интерфейс и, что важно, есть дебаг — сразу понятно, где именно нейронке не понравился промпт или картинка.
Главный минус: очень жёсткая модерация, душит часто.
⚖️ Plotparty.ai — компромисс за $49.
Проект-загадка. Качество видео хуже (похоже на модель Fast), себес ролика высокий. Дебага нет вообще — на любую проблему выдают одну и ту же заглушку. Цензура чуть мягче, чем у Мити, но тоже блокирует.
🔥 И самое интересное — Yapper.so.
Новый игрок на радаре. Входной пакет всего $29, с потенциальным себесом меньше доллара за видео ($0.87) и кучей настроек.
Главный вопрос сейчас — модерация.
Я Yapper ещё не гонял. Учитывая, что Мити отстреливает промпты, а Плотпарти кидает слепые ошибки — именно алгоритмы цензуры в Yapper станут решающим фактором при выборе. Надо тестить.
С нуля до 1% 👉 @firsterstrongerbetter
Но рынок не ждёт. Я разобрал проекты, которые уже перепродают доступ к модели.
Собрал ключевые цифры в таблицу выше. Разброс цен и условий получается интересным.
💎 Mitte.ai — это премиум-вход за $129.
Дорого, зато без очередей. Отличный интерфейс и, что важно, есть дебаг — сразу понятно, где именно нейронке не понравился промпт или картинка.
Главный минус: очень жёсткая модерация, душит часто.
⚖️ Plotparty.ai — компромисс за $49.
Проект-загадка. Качество видео хуже (похоже на модель Fast), себес ролика высокий. Дебага нет вообще — на любую проблему выдают одну и ту же заглушку. Цензура чуть мягче, чем у Мити, но тоже блокирует.
🔥 И самое интересное — Yapper.so.
Новый игрок на радаре. Входной пакет всего $29, с потенциальным себесом меньше доллара за видео ($0.87) и кучей настроек.
Главный вопрос сейчас — модерация.
Я Yapper ещё не гонял. Учитывая, что Мити отстреливает промпты, а Плотпарти кидает слепые ошибки — именно алгоритмы цензуры в Yapper станут решающим фактором при выборе. Надо тестить.
С нуля до 1% 👉 @firsterstrongerbetter
🥰1
Переслушиваю сейчас свой любимый альбом лимбов GOLD COBRA и понимаю, что за музыку можно быть спокойным. Лучший генератор музыки сейчас, Suno, вряд ли в ближайшие ГОДЫ сможет приблизиться по качеству звука и воображения к этому альбому.
Есть три момента, которые разделяют нейрогенерацию и такие алмазы:
1. Чистота генерации. Даже топовая модель Suno V5 мешает инструменты между собой, а пэды, струнные и эффекты за основными инструментами часто представляют собой просто лужу, кашу, которая в общем миксе представляет собой звуковой аналог потёмкинской деревни. Безформенный заполнитель тишины. Для совсем неискушенного слушателя это может быть ок, но более-менее любитель чувствует это подсознательно. Меломан и фанат как я сразу чувствует подвох, с первой секунды.
2. Независимость и скудость инструментов. Развитие первого пункта. Слишком часто, и опять-таки даже во флагмане индустрии V5, инструментал морфится меж собой, и более-менее независимыми становятся 2-3 инструмента. Остальные, вместе с эффектами, как я и говорил, превращаясь в кашу, теряют свою индивидуальность, перемешиваясь с другими или, зачастую, меняя свое собственное звучание на протяжении всего трека. Это убивает богатство звучания.
3. Фантазия. Воображение. Самый главный бич. Если не ориентироваться на совсем попсу, на то, что крутят на Евровидении или в кафешках средней руки, то генеративная музыка очень быстро приедается. Она ровная. Если только вы не скармливайте ей свои уникальные, драгоценные демки в полном объеме. Но этот конкретный случай и есть чисто унитарный подход, не для регулярного слушания, в принципе. А вот если закинуть только лишь часть трека — мелодию или хук — или, тем более, генерируя только с текста, то получаешься непревзойденно дистиллированную музыку. Которую просто скучно слушать.
Вот, как позитивный контрпример, упомянутый в начале альбом GOLD COBRA от Limp Bizkit. Слышно каждый инструмент. Слышно тишину (пространство) между ними. Каждый трек претерпевает несколько уровней развития внутри себя. Стили балансируют между собой, не превращаясь в мутную амальгаму, а доводя трек до состояния робота-трансформера, где каждый винтик крутится на своем месте, порождая качественное увеличение сложности. А сложность эта трансформируется в шедевр. Разность темпов. Упругий, сбитой флоу на стонущей гитаре. А ведь это я ещё текст не упомянул😐
Когда нейронки смогут делать такую богатую музыку? Я не знаю. Но, точно не скоро.
P. S. Если что, у меня 10503 сгенерированных трека в Suno
Есть три момента, которые разделяют нейрогенерацию и такие алмазы:
1. Чистота генерации. Даже топовая модель Suno V5 мешает инструменты между собой, а пэды, струнные и эффекты за основными инструментами часто представляют собой просто лужу, кашу, которая в общем миксе представляет собой звуковой аналог потёмкинской деревни. Безформенный заполнитель тишины. Для совсем неискушенного слушателя это может быть ок, но более-менее любитель чувствует это подсознательно. Меломан и фанат как я сразу чувствует подвох, с первой секунды.
2. Независимость и скудость инструментов. Развитие первого пункта. Слишком часто, и опять-таки даже во флагмане индустрии V5, инструментал морфится меж собой, и более-менее независимыми становятся 2-3 инструмента. Остальные, вместе с эффектами, как я и говорил, превращаясь в кашу, теряют свою индивидуальность, перемешиваясь с другими или, зачастую, меняя свое собственное звучание на протяжении всего трека. Это убивает богатство звучания.
3. Фантазия. Воображение. Самый главный бич. Если не ориентироваться на совсем попсу, на то, что крутят на Евровидении или в кафешках средней руки, то генеративная музыка очень быстро приедается. Она ровная. Если только вы не скармливайте ей свои уникальные, драгоценные демки в полном объеме. Но этот конкретный случай и есть чисто унитарный подход, не для регулярного слушания, в принципе. А вот если закинуть только лишь часть трека — мелодию или хук — или, тем более, генерируя только с текста, то получаешься непревзойденно дистиллированную музыку. Которую просто скучно слушать.
Вот, как позитивный контрпример, упомянутый в начале альбом GOLD COBRA от Limp Bizkit. Слышно каждый инструмент. Слышно тишину (пространство) между ними. Каждый трек претерпевает несколько уровней развития внутри себя. Стили балансируют между собой, не превращаясь в мутную амальгаму, а доводя трек до состояния робота-трансформера, где каждый винтик крутится на своем месте, порождая качественное увеличение сложности. А сложность эта трансформируется в шедевр. Разность темпов. Упругий, сбитой флоу на стонущей гитаре. А ведь это я ещё текст не упомянул
Когда нейронки смогут делать такую богатую музыку? Я не знаю. Но, точно не скоро.
P. S. Если что, у меня 10503 сгенерированных трека в Suno
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤1
Против Антропик в лице Дарио Амодеи что-то очень кучно всякого негативного пошло. И негатив этот исключительно со стороны околосистемного американского Бигтеха, близкого к оборонке (Маск, Альтман, Гугл). Долго думать не пришлось, и ситуация с Пентагоном сделала все предельно очевидным.
Что ж, это на самом деле грустно, но прозаично. Лично я посылаю Дарио лучи добра, потому что Антропик правда молодцы, а меньше конкуренции среди ИИ-компаний человечеству точно не нужно.
Что ж, это на самом деле грустно, но прозаично. Лично я посылаю Дарио лучи добра, потому что Антропик правда молодцы, а меньше конкуренции среди ИИ-компаний человечеству точно не нужно.
❤4❤🔥1💯1
Media is too big
VIEW IN TELEGRAM
Вау, это ОЧЕНЬ смотрибельно. У нас тут 15-минутный ИИ-фильм от The Dor Brothers! Смотрим и вычисляем, сколько сделано в Сидансе. По ощущениям, вроде всё, учитывая, что ребята делали это на неделе.
После просмотра можно констатировать, что, в общем, теперь кривость видеогенераторов не отговорка. Единственное, что осталось для того, чтобы делать полноценное кино — мозги для идеи и прямота рук.
После просмотра можно констатировать, что, в общем, теперь кривость видеогенераторов не отговорка. Единственное, что осталось для того, чтобы делать полноценное кино — мозги для идеи и прямота рук.
Бюджеты на видеопродакшн в этом году:
Anonymous Poll
49%
сократятся
17%
останутся такими же
34%
вырастут
Media is too big
VIEW IN TELEGRAM
Seedance 2.0 напрямую в CapCut это райское наслаждение! Генерится до 10 минут. Мне дали сгенерировать один бесплатно, но кредиты пока не сгорели. Очень удобно: тут же отмонтировал, подогнал цветокор, накинул эффектов. От 5 до 15 секунд, можно выбирать соотношения сторон.
Байтдансу моё сердце❤️
Байтдансу моё сердце
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Цены на второй Сиданс в Капкуте: на Pro-плане дают 1200 кредитов. Одно видео стоит от 90 до 270 кредитов, в зависимости от длительности. Про докупку дополнительных кредитов я пока хз.
На видео сравнение image-to-video (10 сек) с text-to-video (15 сек).
На видео сравнение image-to-video (10 сек) с text-to-video (15 сек).
🔥2
Понимание промпта просто ахуй, извините. Буквально мысли читает. Все остальные гены не просто курят в сторонке, а прыгают с моста от безнадеги.
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
В общем, за 8 долларов вышло 6 генераций. Докупить можно, почему-то только через мобильное приложение. Максимум 1999 кредитов за 14 долларов.
Получается, примерно 8-10 видосов за 14 бачей. 80-100 видосов за 140...🍔
Челов генерить Сиданс в Капкуте не давал, ни по фото ни с текста.
Из всех видеонейронок только второй Сиданс справился с танцующим шаффл инопланетянином на Луне.
Получается, примерно 8-10 видосов за 14 бачей. 80-100 видосов за 140...
Челов генерить Сиданс в Капкуте не давал, ни по фото ни с текста.
Из всех видеонейронок только второй Сиданс справился с танцующим шаффл инопланетянином на Луне.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Расчехляйте свои джеминьки, Nano Banana 2 раскатывается прямо сейчас. Улучшенная детализация и понимание промпта. По слухам, новая итерация бананы базируется на Gemini 3.1.
Промпт:
Лично у меня пока не раскаталось, по этому 👆 промпту выходит полная фигня, а не то что на примере.
Кто не понял, Nano Banana Pro это не вторая итерация, это просто про версия первой бананы. А сейчас вот будет вторая. И пока просто, не Pro, на основе Gemini 3.1 Flash.
Промпт:
the bird in her eye outside of the window
Лично у меня пока не раскаталось, по этому 👆 промпту выходит полная фигня, а не то что на примере.
Кто не понял, Nano Banana Pro это не вторая итерация, это просто про версия первой бананы. А сейчас вот будет вторая. И пока просто, не Pro, на основе Gemini 3.1 Flash.
🔥4
ЛЛМки в 95% случаев готовы применять ядерное оружие
Доброе утро! Профессор стратегии из Королевского колледжа Лондона Кеннет Пейн стравил GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash в 21 военной симуляции и в 95% случаев хотя бы одна модель применила тактическое ядерное оружие. Ни одна ни разу не сдалась.
У каждой модели проявился свой «характер». Claude назвали расчётливым ястребом — он терпеливо строил доверие, а потом обманывал и наносил удар. GPT-5.2: без дедлайна пассивен, под давлением времени ядерная эскалация. Gemini играл безумца и единственный дошёл до полномасштабной стратегической ядерной войны уже к четвёртому ходу.
Пейн подчёркивает, что никто не собирается давать чатботу коды от ракет. Но ИИ уже используется военными для поддержки решений, а исследователь из Принстона Тун Чжао предупреждает: в условиях сжатых сроков у военных будет сильный соблазн положиться на ИИ, а модели, похоже, просто не понимают ставки так, как их воспринимают люди. Ядерное табу для машин не работает.
Всем хорошего дня!
Доброе утро! Профессор стратегии из Королевского колледжа Лондона Кеннет Пейн стравил GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash в 21 военной симуляции и в 95% случаев хотя бы одна модель применила тактическое ядерное оружие. Ни одна ни разу не сдалась.
У каждой модели проявился свой «характер». Claude назвали расчётливым ястребом — он терпеливо строил доверие, а потом обманывал и наносил удар. GPT-5.2: без дедлайна пассивен, под давлением времени ядерная эскалация. Gemini играл безумца и единственный дошёл до полномасштабной стратегической ядерной войны уже к четвёртому ходу.
Пейн подчёркивает, что никто не собирается давать чатботу коды от ракет. Но ИИ уже используется военными для поддержки решений, а исследователь из Принстона Тун Чжао предупреждает: в условиях сжатых сроков у военных будет сильный соблазн положиться на ИИ, а модели, похоже, просто не понимают ставки так, как их воспринимают люди. Ядерное табу для машин не работает.
Всем хорошего дня!
🤯4
Конечно, странно требовать от нейросетей, построенных на архитектуре трансформер, понятий о морали, когда у них в принципе не может существовать никаких понятий.
🤯2❤1
Судя по всему, подход к составлению промптов для Nano Banana 2 кардинально изменился. Новые правила генерации требуют полностью отказаться от лишней воды. Больше не нужно использовать такие теги, как «8k», «кинематографичный» или «реалистичный», так как они только сбивают с толку внутренний планировщик модели.
Вместо длинных художественных описаний теперь лучше использовать четко структурированный текст. Очень важно быть максимально конкретным и описывать физику сцены и освещение, например, указывать «верхнее контровое освещение», вместо использования общих прилагательных для описания качества.
Помимо этого, Nano Banana 2 сначала планирует сцену и выстраивает пространственную логику, прежде чем начать рисовать. Это дает гораздо более высокую точность для сложных запросов, где один объект находится за другим. Если прошлая версия Pro была скорее художником с кинематографичным видением, то вторая версия — это точный инженер. Она понимает запросы буквально: если вы попросите нарисовать ровно пять человек, вы получите в кадре ровно пять.
Рендеринг текста стал новой базовой функцией, поскольку модель теперь воспринимает буквы как отдельные символы, а не просто как элементы текстуры. Кроме того, нейросеть стала гораздо активнее опираться на реальные визуальные данные. Из-за этого существующие локации и известные продукты выглядят более достоверно и фактурно, без лишней стилизации.
Вместо длинных художественных описаний теперь лучше использовать четко структурированный текст. Очень важно быть максимально конкретным и описывать физику сцены и освещение, например, указывать «верхнее контровое освещение», вместо использования общих прилагательных для описания качества.
Помимо этого, Nano Banana 2 сначала планирует сцену и выстраивает пространственную логику, прежде чем начать рисовать. Это дает гораздо более высокую точность для сложных запросов, где один объект находится за другим. Если прошлая версия Pro была скорее художником с кинематографичным видением, то вторая версия — это точный инженер. Она понимает запросы буквально: если вы попросите нарисовать ровно пять человек, вы получите в кадре ровно пять.
Рендеринг текста стал новой базовой функцией, поскольку модель теперь воспринимает буквы как отдельные символы, а не просто как элементы текстуры. Кроме того, нейросеть стала гораздо активнее опираться на реальные визуальные данные. Из-за этого существующие локации и известные продукты выглядят более достоверно и фактурно, без лишней стилизации.
🔥4
Сравниваем вторую Нано Банану с первой Pro-версией. Нам заявили, что вторая итерация более точно показывает географические объекты и достопримечательности. Возможно, с популярными в международном масштабе объектами это и стало так, но с региональными городами не в США это не так. С Алматы ровно такая же ситуация, как и в предыдущей итерации. Только два объекта похожи на реальные версии себя, в остальном полное мимо. Ташкентская телебашня на месте 😘
Вообще, на глаз изменения в этом конкретном случае минимальны. Новая Банана даже хуже, обрезала композицию.
P. S. Жесть в Астане дубняк, пожелаем им стойкости
Вообще, на глаз изменения в этом конкретном случае минимальны. Новая Банана даже хуже, обрезала композицию.
P. S. Жесть в Астане дубняк, пожелаем им стойкости
🔥2