Метаверсище и ИИще – Telegram

Метаверсище и ИИще

49.7K subscribers

6.19K photos

4.79K videos

48 files

7.13K links

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn

Download Telegram

About

Blog

Apps

Platform

Метаверсище и ИИще

49.7K subscribers

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Runway Multi-Shot App

Все без исключения ролики выше сделаны по довольно простым и недлинным промптам.

Без всякого
"Камера1 - бежим
Камера2 - лежим
Камера3 - мешки ворочаем"

Ну то есть ИИ за вас делает мульти-ракурсы и сам решает, где порезать и куда поставить камеру и какой план взять: крупняк, погрудный или общий.

Мне нравится результат, но не нравится замысел. Юзеры, которые и так ни хрена не смыслят в монтаже, вконец потеряют мотивацию что-то изучать. И будут у нас Нейропрожарки по шаблонам Рунвея (и всех, кто это срочно скопирует).

Видео - это 95% монтаж. И он сложный, мать его.

Раскатывают тут:
https://app.runwayml.com/video-tools/teams/cgevent/ai-tools/generate?mode=apps

Если интересный промпты к видосам выше, то они тут:
https://x.com/runwayml/status/2037170118669500537

Лев, конечно, нарядный вышел:

A hyper realistic lion lying on a therapist couch, talking about how hard it is for him to eat the cutest animals. Why not snakes? Why not spiders? No… it has to be zebras. God damn.

👍31🔥19❤6

7.85K viewsSergey Tsyptsyn ️️, 15:42

Метаверсище и ИИще

Media is too big

VIEW IN TELEGRAM

#Нейропрожарка

ROCKY

Автор: Сергей Титов. 3D/2D Motion Designer Generalist, DJ. @no_limit_to_the_infinite

Не устоял и сделал рекламный ролик с помощью ИИ.
У меня еще 3 года назад была идея рекламы охранной системы для дома.
Но не решался, так как понимал, что в полноценном 3D я его один делать буду месяца полтора, не меньше.
Где в потоке работы найти это время? :)
И тут думаю, а че бы не попробовать его с помощью нейронок сделать? Ведь регулярно их в работе использую. Заодно прикину, сколько это стоит и сколько времени.

Работал на платформах Higgsfield и Syntx. Я не спец в промптах, поэтому почти во всех случаях искал или собирал в Photoshop подходящие референсы по композиции и ракурсу. Потом генерировал ключевые кадры в Nano Banana Pro и Seedream 5 Lite. Апскейлил изображения в Clarity, если качество терялось при перегенерациях. А иногда пересобирал шот в Photoshop из нескольких итераций, чтобы первоначальное качество изображения оставить. В Photoshop еще хорошо убирать лишние элементы с помощью "Generative Fill".

Видео генерил почти везде в Kling 3.0 по начальному и конечному фрейму. В некоторых местах Seedream 1.5, она очень хорошо справилась со сценой трансформации меха из шара. Экшн сцены ооооочень трудно давались: то персонажи смазываются, то по действию и камере дич творится :) Приходилось много раз переделывать ракурсы и композиции и пытаться снова. Еще сильно помогала функция упоминания элементов в Higgsfield для Kling 3.0 и Nano Banana Pro. Там можно создавать массив из изображений разных ракурсов персонажей, окружения и т.п. Апскейл некоторых видео (в частности Seedance 1.5, так как разрешение 720p) делал в Topaz.

Собирал всё в After Effects. Взрыв в конце и "speed lines" на трансформации скачал футажами с Envato. Видосы с трансформацией, кстати, генерил на зеленом фоне, чтобы потом подложить "speed lines" нормально и какие захочу.

Музыку сгенерил в Suno, просто по промпту несколько версий и выбрал самую подходящую для нарезки. Звуковые эффекты и голоса персонажей с Envato взял, плюс бесплатные звуки из 99Sound и Boomlibrary. Сводил в Premier Pro. Закадровый голос по тексту сгенерил в ElevenLabs.

К слову, по времени чистой работы 67 часов вышло, это при том, что сценарий уже в голове был.
По деньгам на нейронки ушло примерно 150$. Подписки Envato и Adobe не учитываю, так как они годовые.

Как вам? :)

Платформы: Higgsfield, Syntx
Генерации изображений: Nano Banana, Seadream, Photoshop
Генерации видео: Kling 3.0, Seedance 1.5
Видео футажи: Envato Elements, Adobe Stock
Музыка: Suno, Envato Elements
Звуковые эффекты и голоса: Envato Elements, 99Sounds Free Sounds, Boomlibrary Free Sounds
Закадровый голос: ElevenLabs
Апскейл: изображения - Clarity, видео - Topaz
Композитинг: After Effects

@cgevent

👍75👎27😁11🔥7❤6

6.71K viewsSergey Tsyptsyn ️️, edited 16:03

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

Фотастудио

Вы будете смеяцца, но у нас новый генератор картинок.

"Phota Studio и Phota API — персонализированную модель генерации и редактирования фотографий, обладающую возможностями флагманских моделей обработки изображений, но учитывающую ваши особенности"

Спойлер: у меня есть подозрение, что это не foundation model, а файнтюн и очень ловкий пайплайн на основе других моделей. Грубо говоря, большой и смышленый воркфлоу в Комфи, внутри которого крутятся разные другие модели, лоры, улучшайзеры. И хотя они называют это "моделью", мое чутье говорит, что это не так. Нет technical report, нет упоминания количества параметров, архитектуры и пр.

Спойлер 2: NSFW отсутствует, жесткие фильтры.

Так что я пока назову это генеративным сервисом, заточенным под решение типичных задач фотографов.

Цитирую: "Многие модели изображений заявляют о сохранении индивидуальности. Но как только вы начинаете работать с ними, это обещание часто нарушается. Изображения могут казаться похожими на вас, но на самом деле это не вы. С Phota вы впервые можете создавать, редактировать и улучшать фотографии, сохраняя при этом свою индивидуальность.

Наша цель – фотография, где реальные люди и реальные моменты имеют наибольшее значение . Мы хотим сделать захватывающие фотографии доступными для всех: помочь вам воссоздать моменты, которые вы хотели бы запечатлеть, с другого ракурса, при лучшем освещении, с более естественной позой или просто так, чтобы все смотрели в камеру и естественно улыбались. И более того, мы стремимся создавать новые фотографии реальных людей, которые по-прежнему будут выглядеть как настоящие фотографии, будь то студийный портрет, другая обстановка или момент, который вам так и не удалось запечатлеть."

Ну то есть, можно менять углы, ракурсы, освещение, позу, мимику, сохраняя консистентность. Тут я снова начинаю думать, что под капотом кроется Nano Banana или Квен.

Главная фишка - они включили в сервис тренировку (очевидно Лор) на ваших фотках.
В интерфейсе в просто загружаете минимум 30 фоток (50 макс) и тренируете свою "персону" (Лору).

У них есть API, поэтому я быстро нашел их на Fal.ai и обнаружил там:
phota test-to-image (нет seed, это зашквар) - $0.09 per 1K image and $0.18 per 4K image. Дорого
phota create-profile - собственно тренировка, на входе пакован фоток
phota edit
phota enhance - просто улучшайзер одной картинки (апскейл, деблюр)

В интерфейсе на сайте есть еще стилизатор, добавлятор (человека в существующую фотку), ракурсопоменятор.

На старте дают 20 кредитов (одна генерация в 4К - 4 кредита)
и 2 subject tokens (один токен на свою Лору\Персону)

За 20 долларов в месяц - 600 кредитов (150 картинок в 4К) и 6 тренировок своих Лор.

Довольно дешево для тренировки и дорого для последующих генераций.

В общем выглядит как сервис на основе Бананы или Квена с упором на нужды фотографов.

Я завтра буду занят, не смогу потестить, но вы можете потестить на бесплатных кредитах.

Интересно, что у него (пока) нет фильтров на селебритис, он сожрал у меня Марго Роби, сказал что нашел face of unknown person - можно делать дипфейки.

В общем у меня ощущение, что весь этот сервис можно соорудить в Комфи с большим количеством нод, но кто ж будет заморачиваться, поэтому сервис может зайти фотографам.

Вердикт: Хорошая обертка, но не своя модель.

https://studio.photalabs.com/

Блог:
https://news.photalabs.com/blog/the-new-photo-experience-starts-here

Фал:
https://fal.ai/models/fal-ai/phota

@cgevent

1❤9👍7👎2

6.26K viewsSergey Tsyptsyn ️️, 19:32

Метаверсище и ИИще

Phota Studio == Nano Banana

Чутье меня не подвело (глаз намётан).

Вгрузил туда фотку Марго Роби и говорю "Сделай Про Фотку"
- Апажалста!

А вот уже Марго смотрит в другую сторону.

Дальше взял оригинальную фотку и генерацию, и попросил Gemini пошукать за Synth ID и проверить, была ли использована Nanо Banana при генерации.

На фотке он не нашел водяного знака, как и положено, и даже нашел автора фотки.
На генерации тут же нашел следы использования Нанабананы.

Так что это обертка вокруг Бананы.

@cgevent

👍28🔥12❤6

7.36K viewsSergey Tsyptsyn ️️, 19:55

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

Suno 5.5

Сунчанский обновился и главная фишка - возможность вгружать свой (чужой) голос и ну распевать им пестни.

Народ жалуется, что все застревают на этапе "Verifying your voice"

Ну и мне интересно, неужто они будут\могут распознавать голоса известных исполнителей и отсекать попытки спеть чужим голосом?

Думаю у русскоязычных каверов будет период нового расцвета, вряд ли Суно знает голос Монеточки или Гречки.

А голоса можно натырить из интервью в сети...

@cgevent

❤44😁15👎2🔥2

11.4K viewsSergey Tsyptsyn ️️, edited 20:08

Метаверсище и ИИще

Media is too big

VIEW IN TELEGRAM

Аватары от Pika Labs

Позиционируются как AI Selves (ИИ-себяшки, бррр).

Делаете фото, записываете голос, даете контекст и оно за вас может чатиться на разных платформах.
Текстом.
Но нас же интересуют аватары.
А они:
1. С хреновым липсинком. И деревянной мимикой.
2. НЕ реалтаймовые, как у Runway.

Пропускаем.

https://www.pika.me/

@cgevent

8.53K viewsSergey Tsyptsyn ️️, edited 08:34

Метаверсище и ИИще

Опрос: с какого устройства вы чаще всего читаете этот канал?

Anonymous Poll

Чаще с компьютера

Чаще с телефона

2.03K voters7.61K viewsSergey Tsyptsyn ️️, 09:09

Метаверсище и ИИще

Forwarded from Сиолошная

Представляете вот вы открываете последнюю статью Terence Tao, «Моцарта от мира математики», а там написано «Первое из этих предположений было доказано с помощью ChatGPT».

А представлять теперь и не надо 😭

В своём блоге автор даёт пояснение:
— Я так и не понял, как доказать это неравенство, но решил попытать счастья и дать его ChatGPT Pro <и он решил его>

Сомнений что без модели математик смог бы разобраться у меня нет; но теперь и решать самому не нужно, достаточно проверить и/или развить идеи, предложенные моделью. Terence последний год+ очень топит за верифицируемую математику — это когда все условия и доказательства записаны на специальном языке программирования, и компьютер проверяет решение, компилируя его. Если ошибок нет, то почти наверняка решение правильное.

И тогда остаётся лишь проверять, что исходные условия + вердикт формализованы правильно — и всё. Звучит чудесно? Да, но к сожалению ручная формализция на этом языке очень времязатратна, на сложные доказательства могут уходить месяцы. И тут тоже помогает AI — см. Gauss.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤18👍9😁5🔥4

5.92K viewsSergey Tsyptsyn ️️, 12:19

Метаверсище и ИИще

Голосовой ввод

Многие говорят, что пользуются голосовым вводом и что это экономит время.

Я тут вайбкожу на досуге и пришел вот к чему: чтобы наговорить Gemini задание, я должен Продумать это задание, декомпозировать задачу на разные инструкции, описать каждую, расписать в каком виде я хочу получить результат. Пока я пишу промпт, я все это проделываю в голове и в Notepad++, исправляю текст, вижу где нестыковки, уточняю, редактирую, потом бахаю. Чтобы наговорить промпт, я должен всю эту работу проделать в голове, а лучше на бумажке. И только потом включить микрофон.

На итоге получается примерно столько же времени - что для написания промпта, что для продумывания и наговаривания.

Возможно я слоупок и не умею быстро думать, меня просто учили семь раз отмерять в голове, а потом резать.

Возможно для задач написания текстов или поиска инфо в интернете голос будет быстрее. Но для кодинга у меня не получается.

Как у вас?

@cgevent

❤65👍63

7.17K viewsSergey Tsyptsyn ️️, 12:29

Метаверсище и ИИще

Наткнулся на вот такой сервис. Навело на разные мысли.

Интересен он тем, что на нем собраны не столько модели, сколько задачи, которые сейчас народ решает с помощью нейросеток.

Зашел в Инструменты AI, а там огромный выводок задач: от удаления фона и фейссвапа, до стикер-мастера и векторных баз данных.
Подумалось мне, что продажа решений под задачу выглядит более адекватно, чем продажа доступов к конкретным моделям. Юзеру надо порешать проблему и он не в курсе, кто щас лучший в том или ином вопросе.

Ну и интересно было поглядеть на самые популярные проблемы, на которые есть запросы в 2026 году.
Некий срез интересов.

Выглядит правда немного (сильно) эклектично: Перенос движения подписан, что это Runway Act, а отдельный раздел "Контроль движения" в Креатив Лаб никак не обозначен, что это Клинг. Векторизатор тоже безымянный, неизвестно какой используется. Про Суно я вообще озадачен, у него вроде нет API, как он сюда прикручен. Тоже самое с Midjourney..

Есть и доступ к "традиционным" генераторам: правда Seedance пока старенький, а недавно почившая в бозе Sora-2 еще присутствует.

Но я щас больше о том, что продажа решений, возможно, в будущем будет мейнстримом - юзерам лень разбирацца, что под капотом.

А еще меня удивило, что нет навязчивого подписочного рабства с ежемесячными списаниями, платишь за решение задачи, разово. И в 60–70% случаев можно вытащить условную эротику, на которую агрегаторы часто выдают моментальный бан. Хотя для этого есть специальные агрегаторы.

Похоже будущее за агрегаторам задач, а не нейросетей. С кнопками "Сделай быстро и красиво".

https://gptunnel.ru/

@cgevent

🔥23😁17👍11👎8❤5

7.55K viewsSergey Tsyptsyn ️️, 12:32

Метаверсище и ИИще

Про Нейропрожарку.

Спойлер: сегодня будет юбилейная двухсотая Нейропрожарка. И она будет просто убойная, готовьтесь.

Под это дело я довайбкодил Нейростатистику: сделал заголовки Sticky, чтобы не уезжали, добавил сразу сортировку по Диз Балансу, чтобы чемпионы сразу появлялись вверху и не надо было расставлять места, можно обратно отсортировать по дате, починил сортировку по просмотрам (там с большим отрывом в топе Максим Фадеев и драка Цукера с Альтманом плачем по лоботомированну Seedance 2.0)

Я периодически ловлю в коментах мнение, что Нейропрожарка достала, что кому-то неинтересно, что надо ее в отдельный канал.

Нет.

Нейропрожарка, похоже, явление совершенно уникальное, многие мне пишут, что нашли через нее работу и заказы, что научились чему-то, что ждут каждый день. Ну и я больше, чем полгода отбираю, оформляю и пощщу ваши работы. Бесплатно. Это, намнтчку, нехилый труд. Поэтому, сорри, буду продолжать.

Я даже сделаю щас опрос про это. Но даже если вы проголосуете, чтобы Прожарку из канала убрать, я авторитарно буду продолжать это делать.

"Спокойной ночи, Нейромалыши" ждет вас каждый вечер по будням.

Жду тысячи лайков под постом. Ну или дизлайков.

@cgevent

👍114🔥27👎19❤16😁4

7.47K viewsSergey Tsyptsyn ️️, edited 15:30

Метаверсище и ИИще

Опрос: убрать Нейропрожарку в отдельный канал?

Anonymous Poll

Да, убрать

Нет, не убирать

😁3❤1

1.95K voters7.51K viewsSergey Tsyptsyn ️️, 15:33

Метаверсище и ИИще

Media is too big

VIEW IN TELEGRAM

#Нейропрожарка

Короткометражка: ЯЙЦА. Двухсотая юбилейная Нейропрожарка.

Спойлер. Мне написал Таш Андреасян (старший брат Сарика) и сказал, что давно следит за прожаркой. И что у него самого есть много материала для рубрики. Я, конечно, немного офигел о того, какие уважаемые люди подписаны на меня. И с удовольствием взял в прожарку фильм "Яйца". Мне нравится - профессиональный монтаж и озвучка - решают. Сценарий и юмор - решают. Также когда будете смотреть, имейте в виду, что это сделано аж в августе 2025 года. И что можно было выжать из Клинга тогда.

Итак.

Автор: @artashesandreasyan Сайт студии: https://andreasyan.art/

Работа в кайф: Это удивительно правдивый монолог о смелости, лидерстве и дефиците главного ресурса человечества.

О себе: Меня зовут Таш Андреасян (Старший) , я занимаюсь созданием ИИ фильмов, клипов и роликов.

Для работы со статикой использовал: Midjourney, Nano Banana

Для анимации использовал: Kling 2.0 / 2.5 и Veo 3.0,

Монтаж: FINAL CUT

Сведение звука: PRO TOOLS

Музыка: басс линию скомунистил у Адриано Челентано (L'Unica Chance 1973 года). Остальная аранжировка полностью моя, финальная часть (вокал) SUNO

Озвучка по дружески: Даниил Ильдаров.

На производство ушло 8 часов.

По затратам 3 - 5 000 рублей

@cgevent

65👍309K👎13.1K🔥130❤69😁49😱10

33.4K viewsSergey Tsyptsyn ️️, edited 16:05

Метаверсище и ИИще

CapCut x Dreamina Seedance 2.0 User Guide пишет, что раскатали в Европе, UK, Канаде, Австралии.

Штатов в списке нет.

Завтра буду пробовать.

Юзер гайд тут:

https://bytedance.larkoffice.com/wiki/Fdz8wMypwizGLzkziiCc2N5vnjg

Гайд, кстати, огромный. Структура промпта, диалоги эффекты, аудио.

Там же написано, что "В связи с требованиями к соответствию платформы в настоящее время не поддерживается загрузка материалов, содержащих изображения реальных лиц, включая как фотографии, так и видеоматериалы."

@cgevent

1🔥41❤5

9.74K viewsSergey Tsyptsyn ️️, edited 23:15

Метаверсище и ИИще

Интересное продолжение истории с Phota AI

Я сразу высказывал предположение, что это обертка над Нанабананой. Предположение подтвердилось и в твитторе нехило так пригорело.

Некоторые агрегаторы моделей (например Letz.AI) так рассвирепели, что выкинули PhotaAI из списка моделей, доступных на их сервисах.

У всех один вопрос - почему вы называете это своей моделью, а на итоге продаете доступ к Банане?

Phota AI были вынуждены сделать пространный твит, из которого следует, что ИХ модель используется только если вы натренировали profile(Лору) на своих\чужих лицах, а потом запускаете генерацию с указанием на этот profile. Пост полон double speaking и по-прежнему неясно, что это за мифическая модель.

Народ прямо их спрашивает: ну то есть когда на вашем сервисе запускается text2image, edit или enhance - это тупо перепродажа Бананы?

Отмалчиваюццо.

Точнее пишут, "у нас там топовые модели типа NBP".

Все бы ничего, если бы они с самого начала сказали "мы сделали сервис на базе Бананы, вот наши фишки". Но нет, они раздали бета-тестерам именно "новую модель", а потом с помпой бахнули НАША МОДЕЛЬ умеет всё!

Под капотом два архаровца из Адобченко, которые подняли денег в a16z и запилили сервис.

P.S. Сервис-то неплохой, решает некоторые задачи относящиеся именно к работе фотографов. Но маркетинг зашкварный. За что и поплатились.

@cgevent

1❤15👍9😁4

8.57K viewsSergey Tsyptsyn ️️, edited 14:55

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

Ну, за уличных танцоров

Вот вы спрашивали, для чего их делают антропоморфными.

Для радости...

@cgevent

3😁77🔥29😱11❤7👎7👍5

24.5K viewsSergey Tsyptsyn ️️, 22:24