Метаверсище и ИИще
49.7K subscribers
6.19K photos
4.79K videos
48 files
7.13K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Runway Multi-Shot App

Все без исключения ролики выше сделаны по довольно простым и недлинным промптам.

Без всякого
"Камера1 - бежим
Камера2 - лежим
Камера3 - мешки ворочаем"

Ну то есть ИИ за вас делает мульти-ракурсы и сам решает, где порезать и куда поставить камеру и какой план взять: крупняк, погрудный или общий.

Мне нравится результат, но не нравится замысел. Юзеры, которые и так ни хрена не смыслят в монтаже, вконец потеряют мотивацию что-то изучать. И будут у нас Нейропрожарки по шаблонам Рунвея (и всех, кто это срочно скопирует).

Видео - это 95% монтаж. И он сложный, мать его.

Раскатывают тут:
https://app.runwayml.com/video-tools/teams/cgevent/ai-tools/generate?mode=apps

Если интересный промпты к видосам выше, то они тут:
https://x.com/runwayml/status/2037170118669500537

Лев, конечно, нарядный вышел:

A hyper realistic lion lying on a therapist couch, talking about how hard it is for him to eat the cutest animals. Why not snakes? Why not spiders? No… it has to be zebras. God damn.


@cgevent
👍31🔥196
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

ROCKY

Автор: Сергей Титов. 3D/2D Motion Designer Generalist, DJ. @no_limit_to_the_infinite

Не устоял и сделал рекламный ролик с помощью ИИ.
У меня еще 3 года назад была идея рекламы охранной системы для дома.
Но не решался, так как понимал, что в полноценном 3D я его один делать буду месяца полтора, не меньше.
Где в потоке работы найти это время? :)
И тут думаю, а че бы не попробовать его с помощью нейронок сделать? Ведь регулярно их в работе использую. Заодно прикину, сколько это стоит и сколько времени.

Работал на платформах Higgsfield и Syntx. Я не спец в промптах, поэтому почти во всех случаях искал или собирал в Photoshop подходящие референсы по композиции и ракурсу. Потом генерировал ключевые кадры в Nano Banana Pro и Seedream 5 Lite. Апскейлил изображения в Clarity, если качество терялось при перегенерациях. А иногда пересобирал шот в Photoshop из нескольких итераций, чтобы первоначальное качество изображения оставить. В Photoshop еще хорошо убирать лишние элементы с помощью "Generative Fill".

Видео генерил почти везде в Kling 3.0 по начальному и конечному фрейму. В некоторых местах Seedream 1.5, она очень хорошо справилась со сценой трансформации меха из шара. Экшн сцены ооооочень трудно давались: то персонажи смазываются, то по действию и камере дич творится :) Приходилось много раз переделывать ракурсы и композиции и пытаться снова. Еще сильно помогала функция упоминания элементов в Higgsfield для Kling 3.0 и Nano Banana Pro. Там можно создавать массив из изображений разных ракурсов персонажей, окружения и т.п. Апскейл некоторых видео (в частности Seedance 1.5, так как разрешение 720p) делал в Topaz.

Собирал всё в After Effects. Взрыв в конце и "speed lines" на трансформации скачал футажами с Envato. Видосы с трансформацией, кстати, генерил на зеленом фоне, чтобы потом подложить "speed lines" нормально и какие захочу.

Музыку сгенерил в Suno, просто по промпту несколько версий и выбрал самую подходящую для нарезки. Звуковые эффекты и голоса персонажей с Envato взял, плюс бесплатные звуки из 99Sound и Boomlibrary. Сводил в Premier Pro. Закадровый голос по тексту сгенерил в ElevenLabs.

К слову, по времени чистой работы 67 часов вышло, это при том, что сценарий уже в голове был.
По деньгам на нейронки ушло примерно 150$. Подписки Envato и Adobe не учитываю, так как они годовые.

Как вам? :)

Платформы: Higgsfield, Syntx
Генерации изображений: Nano Banana, Seadream, Photoshop
Генерации видео: Kling 3.0, Seedance 1.5
Видео футажи: Envato Elements, Adobe Stock
Музыка: Suno, Envato Elements
Звуковые эффекты и голоса: Envato Elements, 99Sounds Free Sounds, Boomlibrary Free Sounds
Закадровый голос: ElevenLabs
Апскейл: изображения - Clarity, видео - Topaz
Композитинг: After Effects


@cgevent
👍75👎27😁11🔥76
This media is not supported in your browser
VIEW IN TELEGRAM
Фотастудио

Вы будете смеяцца, но у нас новый генератор картинок.

"Phota Studio и Phota API — персонализированную модель генерации и редактирования фотографий, обладающую возможностями флагманских моделей обработки изображений, но учитывающую ваши особенности"

Спойлер: у меня есть подозрение, что это не foundation model, а файнтюн и очень ловкий пайплайн на основе других моделей. Грубо говоря, большой и смышленый воркфлоу в Комфи, внутри которого крутятся разные другие модели, лоры, улучшайзеры. И хотя они называют это "моделью", мое чутье говорит, что это не так. Нет technical report, нет упоминания количества параметров, архитектуры и пр.

Спойлер 2: NSFW отсутствует, жесткие фильтры.

Так что я пока назову это генеративным сервисом, заточенным под решение типичных задач фотографов.

Цитирую: "Многие модели изображений заявляют о сохранении индивидуальности. Но как только вы начинаете работать с ними, это обещание часто нарушается. Изображения могут казаться похожими на вас, но на самом деле это не вы. С Phota вы впервые можете создавать, редактировать и улучшать фотографии, сохраняя при этом свою индивидуальность.

Наша цель – фотография, где реальные люди и реальные моменты имеют наибольшее значение . Мы хотим сделать захватывающие фотографии доступными для всех: помочь вам воссоздать моменты, которые вы хотели бы запечатлеть, с другого ракурса, при лучшем освещении, с более естественной позой или просто так, чтобы все смотрели в камеру и естественно улыбались. И более того, мы стремимся создавать новые фотографии реальных людей, которые по-прежнему будут выглядеть как настоящие фотографии, будь то студийный портрет, другая обстановка или момент, который вам так и не удалось запечатлеть."

Ну то есть, можно менять углы, ракурсы, освещение, позу, мимику, сохраняя консистентность. Тут я снова начинаю думать, что под капотом кроется Nano Banana или Квен.

Главная фишка - они включили в сервис тренировку (очевидно Лор) на ваших фотках.
В интерфейсе в просто загружаете минимум 30 фоток (50 макс) и тренируете свою "персону" (Лору).

У них есть API, поэтому я быстро нашел их на Fal.ai и обнаружил там:
phota test-to-image (нет seed, это зашквар) - $0.09 per 1K image and $0.18 per 4K image. Дорого
phota create-profile - собственно тренировка, на входе пакован фоток
phota edit
phota enhance - просто улучшайзер одной картинки (апскейл, деблюр)

В интерфейсе на сайте есть еще стилизатор, добавлятор (человека в существующую фотку), ракурсопоменятор.

На старте дают 20 кредитов (одна генерация в 4К - 4 кредита)
и 2 subject tokens (один токен на свою Лору\Персону)

За 20 долларов в месяц - 600 кредитов (150 картинок в 4К) и 6 тренировок своих Лор.

Довольно дешево для тренировки и дорого для последующих генераций.

В общем выглядит как сервис на основе Бананы или Квена с упором на нужды фотографов.

Я завтра буду занят, не смогу потестить, но вы можете потестить на бесплатных кредитах.

Интересно, что у него (пока) нет фильтров на селебритис, он сожрал у меня Марго Роби, сказал что нашел face of unknown person - можно делать дипфейки.

В общем у меня ощущение, что весь этот сервис можно соорудить в Комфи с большим количеством нод, но кто ж будет заморачиваться, поэтому сервис может зайти фотографам.

Вердикт: Хорошая обертка, но не своя модель.

https://studio.photalabs.com/

Блог:
https://news.photalabs.com/blog/the-new-photo-experience-starts-here

Фал:
https://fal.ai/models/fal-ai/phota

@cgevent
19👍7👎2
Phota Studio == Nano Banana

Чутье меня не подвело (глаз намётан).

Вгрузил туда фотку Марго Роби и говорю "Сделай Про Фотку"
- Апажалста!

А вот уже Марго смотрит в другую сторону.

Дальше взял оригинальную фотку и генерацию, и попросил Gemini пошукать за Synth ID и проверить, была ли использована Nanо Banana при генерации.

На фотке он не нашел водяного знака, как и положено, и даже нашел автора фотки.
На генерации тут же нашел следы использования Нанабананы.

Так что это обертка вокруг Бананы.

@cgevent
👍28🔥126
This media is not supported in your browser
VIEW IN TELEGRAM
Suno 5.5

Сунчанский обновился и главная фишка - возможность вгружать свой (чужой) голос и ну распевать им пестни.

Народ жалуется, что все застревают на этапе "Verifying your voice"

Ну и мне интересно, неужто они будут\могут распознавать голоса известных исполнителей и отсекать попытки спеть чужим голосом?

Думаю у русскоязычных каверов будет период нового расцвета, вряд ли Суно знает голос Монеточки или Гречки.

А голоса можно натырить из интервью в сети...

@cgevent
44😁15👎2🔥2
Media is too big
VIEW IN TELEGRAM
Аватары от Pika Labs

Позиционируются как AI Selves (ИИ-себяшки, бррр).

Делаете фото, записываете голос, даете контекст и оно за вас может чатиться на разных платформах.
Текстом.
Но нас же интересуют аватары.
А они:
1. С хреновым липсинком. И деревянной мимикой.
2. НЕ реалтаймовые, как у Runway.

Пропускаем.

https://www.pika.me/

@cgevent
Опрос: с какого устройства вы чаще всего читаете этот канал?
Anonymous Poll
31%
Чаще с компьютера
69%
Чаще с телефона
Forwarded from Сиолошная
Представляете вот вы открываете последнюю статью Terence Tao, «Моцарта от мира математики», а там написано «Первое из этих предположений было доказано с помощью ChatGPT».

А представлять теперь и не надо 😭

В своём блоге автор даёт пояснение:
— Я так и не понял, как доказать это неравенство, но решил попытать счастья и дать его ChatGPT Pro <и он решил его>

Сомнений что без модели математик смог бы разобраться у меня нет; но теперь и решать самому не нужно, достаточно проверить и/или развить идеи, предложенные моделью. Terence последний год+ очень топит за верифицируемую математику — это когда все условия и доказательства записаны на специальном языке программирования, и компьютер проверяет решение, компилируя его. Если ошибок нет, то почти наверняка решение правильное.

И тогда остаётся лишь проверять, что исходные условия + вердикт формализованы правильно — и всё. Звучит чудесно? Да, но к сожалению ручная формализция на этом языке очень времязатратна, на сложные доказательства могут уходить месяцы. И тут тоже помогает AI — см. Gauss.
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍9😁5🔥4
Голосовой ввод

Многие говорят, что пользуются голосовым вводом и что это экономит время.

Я тут вайбкожу на досуге и пришел вот к чему: чтобы наговорить Gemini задание, я должен Продумать это задание, декомпозировать задачу на разные инструкции, описать каждую, расписать в каком виде я хочу получить результат. Пока я пишу промпт, я все это проделываю в голове и в Notepad++, исправляю текст, вижу где нестыковки, уточняю, редактирую, потом бахаю. Чтобы наговорить промпт, я должен всю эту работу проделать в голове, а лучше на бумажке. И только потом включить микрофон.

На итоге получается примерно столько же времени - что для написания промпта, что для продумывания и наговаривания.

Возможно я слоупок и не умею быстро думать, меня просто учили семь раз отмерять в голове, а потом резать.

Возможно для задач написания текстов или поиска инфо в интернете голос будет быстрее. Но для кодинга у меня не получается.

Как у вас?

@cgevent
65👍63
Наткнулся на вот такой сервис. Навело на разные мысли.

Интересен он тем, что на нем собраны не столько модели, сколько задачи, которые сейчас народ решает с помощью нейросеток.

Зашел в Инструменты AI, а там огромный выводок задач: от удаления фона и фейссвапа, до стикер-мастера и векторных баз данных.
Подумалось мне, что продажа решений под задачу выглядит более адекватно, чем продажа доступов к конкретным моделям. Юзеру надо порешать проблему и он не в курсе, кто щас лучший в том или ином вопросе.

Ну и интересно было поглядеть на самые популярные проблемы, на которые есть запросы в 2026 году.
Некий срез интересов.

Выглядит правда немного (сильно) эклектично: Перенос движения подписан, что это Runway Act, а отдельный раздел "Контроль движения" в Креатив Лаб никак не обозначен, что это Клинг. Векторизатор тоже безымянный, неизвестно какой используется. Про Суно я вообще озадачен, у него вроде нет API, как он сюда прикручен. Тоже самое с Midjourney..

Есть и доступ к "традиционным" генераторам: правда Seedance пока старенький, а недавно почившая в бозе Sora-2 еще присутствует.

Но я щас больше о том, что продажа решений, возможно, в будущем будет мейнстримом - юзерам лень разбирацца, что под капотом.

А еще меня удивило, что нет навязчивого подписочного рабства с ежемесячными списаниями, платишь за решение задачи, разово. И в 60–70% случаев можно вытащить условную эротику, на которую агрегаторы часто выдают моментальный бан. Хотя для этого есть специальные агрегаторы.

Похоже будущее за агрегаторам задач, а не нейросетей. С кнопками "Сделай быстро и красиво".

https://gptunnel.ru/

@cgevent
🔥23😁17👍11👎85
Про Нейропрожарку.

Спойлер: сегодня будет юбилейная двухсотая Нейропрожарка. И она будет просто убойная, готовьтесь.

Под это дело я довайбкодил Нейростатистику: сделал заголовки Sticky, чтобы не уезжали, добавил сразу сортировку по Диз Балансу, чтобы чемпионы сразу появлялись вверху и не надо было расставлять места, можно обратно отсортировать по дате, починил сортировку по просмотрам (там с большим отрывом в топе Максим Фадеев и драка Цукера с Альтманом плачем по лоботомированну Seedance 2.0)

Я периодически ловлю в коментах мнение, что Нейропрожарка достала, что кому-то неинтересно, что надо ее в отдельный канал.

Нет.

Нейропрожарка, похоже, явление совершенно уникальное, многие мне пишут, что нашли через нее работу и заказы, что научились чему-то, что ждут каждый день. Ну и я больше, чем полгода отбираю, оформляю и пощщу ваши работы. Бесплатно. Это, намнтчку, нехилый труд. Поэтому, сорри, буду продолжать.

Я даже сделаю щас опрос про это. Но даже если вы проголосуете, чтобы Прожарку из канала убрать, я авторитарно буду продолжать это делать.

"Спокойной ночи, Нейромалыши" ждет вас каждый вечер по будням.

Жду тысячи лайков под постом. Ну или дизлайков.

@cgevent
👍114🔥27👎1916😁4
Опрос: убрать Нейропрожарку в отдельный канал?
Anonymous Poll
48%
Да, убрать
52%
Нет, не убирать
😁31
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

Короткометражка: ЯЙЦА. Двухсотая юбилейная Нейропрожарка.

Спойлер. Мне написал Таш Андреасян (старший брат Сарика) и сказал, что давно следит за прожаркой. И что у него самого есть много материала для рубрики. Я, конечно, немного офигел о того, какие уважаемые люди подписаны на меня. И с удовольствием взял в прожарку фильм "Яйца". Мне нравится - профессиональный монтаж и озвучка - решают. Сценарий и юмор - решают. Также когда будете смотреть, имейте в виду, что это сделано аж в августе 2025 года. И что можно было выжать из Клинга тогда.

Итак.

Автор: @artashesandreasyan Сайт студии: https://andreasyan.art/

Работа в кайф: Это удивительно правдивый монолог о смелости, лидерстве и дефиците главного ресурса человечества.

О себе: Меня зовут Таш Андреасян (Старший) , я занимаюсь созданием ИИ фильмов, клипов и роликов.

Для работы со статикой использовал: Midjourney, Nano Banana

Для анимации использовал: Kling 2.0 / 2.5 и Veo 3.0,

Монтаж: FINAL CUT

Сведение звука: PRO TOOLS

Музыка: басс линию скомунистил у Адриано Челентано (L'Unica Chance 1973 года). Остальная аранжировка полностью моя, финальная часть (вокал) SUNO

Озвучка по дружески: Даниил Ильдаров.

На производство ушло 8 часов.

По затратам 3 - 5 000 рублей


@cgevent
65👍309K👎13.1K🔥13069😁49😱10
CapCut x Dreamina Seedance 2.0 User Guide пишет, что раскатали в Европе, UK, Канаде, Австралии.

Штатов в списке нет.

Завтра буду пробовать.

Юзер гайд тут:

https://bytedance.larkoffice.com/wiki/Fdz8wMypwizGLzkziiCc2N5vnjg

Гайд, кстати, огромный. Структура промпта, диалоги эффекты, аудио.

Там же написано, что "В связи с требованиями к соответствию платформы в настоящее время не поддерживается загрузка материалов, содержащих изображения реальных лиц, включая как фотографии, так и видеоматериалы."

@cgevent
1🔥415
Интересное продолжение истории с Phota AI

Я сразу высказывал предположение, что это обертка над Нанабананой. Предположение подтвердилось и в твитторе нехило так пригорело.

Некоторые агрегаторы моделей (например Letz.AI) так рассвирепели, что выкинули PhotaAI из списка моделей, доступных на их сервисах.

У всех один вопрос - почему вы называете это своей моделью, а на итоге продаете доступ к Банане?

Phota AI были вынуждены сделать пространный твит, из которого следует, что ИХ модель используется только если вы натренировали profile(Лору) на своих\чужих лицах, а потом запускаете генерацию с указанием на этот profile. Пост полон double speaking и по-прежнему неясно, что это за мифическая модель.

Народ прямо их спрашивает: ну то есть когда на вашем сервисе запускается text2image, edit или enhance - это тупо перепродажа Бананы?

Отмалчиваюццо.

Точнее пишут, "у нас там топовые модели типа NBP".

Все бы ничего, если бы они с самого начала сказали "мы сделали сервис на базе Бананы, вот наши фишки". Но нет, они раздали бета-тестерам именно "новую модель", а потом с помпой бахнули НАША МОДЕЛЬ умеет всё!

Под капотом два архаровца из Адобченко, которые подняли денег в a16z и запилили сервис.

P.S. Сервис-то неплохой, решает некоторые задачи относящиеся именно к работе фотографов. Но маркетинг зашкварный. За что и поплатились.

@cgevent
115👍9😁4
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за уличных танцоров

Вот вы спрашивали, для чего их делают антропоморфными.

Для радости...

@cgevent
3😁77🔥29😱117👎7👍5