This media is not supported in your browser
VIEW IN TELEGRAM
Suno 5.5
Сунчанский обновился и главная фишка - возможность вгружать свой (чужой) голос и ну распевать им пестни.
Народ жалуется, что все застревают на этапе "Verifying your voice"
Ну и мне интересно, неужто они будут\могут распознавать голоса известных исполнителей и отсекать попытки спеть чужим голосом?
Думаю у русскоязычных каверов будет период нового расцвета, вряд ли Суно знает голос Монеточки или Гречки.
А голоса можно натырить из интервью в сети...
@cgevent
Сунчанский обновился и главная фишка - возможность вгружать свой (чужой) голос и ну распевать им пестни.
Народ жалуется, что все застревают на этапе "Verifying your voice"
Ну и мне интересно, неужто они будут\могут распознавать голоса известных исполнителей и отсекать попытки спеть чужим голосом?
Думаю у русскоязычных каверов будет период нового расцвета, вряд ли Суно знает голос Монеточки или Гречки.
А голоса можно натырить из интервью в сети...
@cgevent
❤44😁15👎2🔥2
Media is too big
VIEW IN TELEGRAM
Аватары от Pika Labs
Позиционируются как AI Selves (ИИ-себяшки, бррр).
Делаете фото, записываете голос, даете контекст и оно за вас может чатиться на разных платформах.
Текстом.
Но нас же интересуют аватары.
А они:
1. С хреновым липсинком. И деревянной мимикой.
2. НЕ реалтаймовые, как у Runway.
Пропускаем.
https://www.pika.me/
@cgevent
Позиционируются как AI Selves (ИИ-себяшки, бррр).
Делаете фото, записываете голос, даете контекст и оно за вас может чатиться на разных платформах.
Текстом.
Но нас же интересуют аватары.
А они:
1. С хреновым липсинком. И деревянной мимикой.
2. НЕ реалтаймовые, как у Runway.
Пропускаем.
https://www.pika.me/
@cgevent
Опрос: с какого устройства вы чаще всего читаете этот канал?
Anonymous Poll
31%
Чаще с компьютера
69%
Чаще с телефона
Forwarded from Сиолошная
Представляете вот вы открываете последнюю статью Terence Tao, «Моцарта от мира математики», а там написано «Первое из этих предположений было доказано с помощью ChatGPT».
А представлять теперь и не надо😭
В своём блоге автор даёт пояснение:
— Я так и не понял, как доказать это неравенство, но решил попытать счастья и дать его ChatGPT Pro <и он решил его>
Сомнений что без модели математик смог бы разобраться у меня нет; но теперь и решать самому не нужно, достаточно проверить и/или развить идеи, предложенные моделью. Terence последний год+ очень топит за верифицируемую математику — это когда все условия и доказательства записаны на специальном языке программирования, и компьютер проверяет решение, компилируя его. Если ошибок нет, то почти наверняка решение правильное.
И тогда остаётся лишь проверять, что исходные условия + вердикт формализованы правильно — и всё. Звучит чудесно? Да, но к сожалению ручная формализция на этом языке очень времязатратна, на сложные доказательства могут уходить месяцы. И тут тоже помогает AI — см. Gauss.
А представлять теперь и не надо
В своём блоге автор даёт пояснение:
— Я так и не понял, как доказать это неравенство, но решил попытать счастья и дать его ChatGPT Pro <и он решил его>
Сомнений что без модели математик смог бы разобраться у меня нет; но теперь и решать самому не нужно, достаточно проверить и/или развить идеи, предложенные моделью. Terence последний год+ очень топит за верифицируемую математику — это когда все условия и доказательства записаны на специальном языке программирования, и компьютер проверяет решение, компилируя его. Если ошибок нет, то почти наверняка решение правильное.
И тогда остаётся лишь проверять, что исходные условия + вердикт формализованы правильно — и всё. Звучит чудесно? Да, но к сожалению ручная формализция на этом языке очень времязатратна, на сложные доказательства могут уходить месяцы. И тут тоже помогает AI — см. Gauss.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18👍9😁5🔥4
Голосовой ввод
Многие говорят, что пользуются голосовым вводом и что это экономит время.
Я тут вайбкожу на досуге и пришел вот к чему: чтобы наговорить Gemini задание, я должен Продумать это задание, декомпозировать задачу на разные инструкции, описать каждую, расписать в каком виде я хочу получить результат. Пока я пишу промпт, я все это проделываю в голове и в Notepad++, исправляю текст, вижу где нестыковки, уточняю, редактирую, потом бахаю. Чтобы наговорить промпт, я должен всю эту работу проделать в голове, а лучше на бумажке. И только потом включить микрофон.
На итоге получается примерно столько же времени - что для написания промпта, что для продумывания и наговаривания.
Возможно я слоупок и не умею быстро думать, меня просто учили семь раз отмерять в голове, а потом резать.
Возможно для задач написания текстов или поиска инфо в интернете голос будет быстрее. Но для кодинга у меня не получается.
Как у вас?
@cgevent
Многие говорят, что пользуются голосовым вводом и что это экономит время.
Я тут вайбкожу на досуге и пришел вот к чему: чтобы наговорить Gemini задание, я должен Продумать это задание, декомпозировать задачу на разные инструкции, описать каждую, расписать в каком виде я хочу получить результат. Пока я пишу промпт, я все это проделываю в голове и в Notepad++, исправляю текст, вижу где нестыковки, уточняю, редактирую, потом бахаю. Чтобы наговорить промпт, я должен всю эту работу проделать в голове, а лучше на бумажке. И только потом включить микрофон.
На итоге получается примерно столько же времени - что для написания промпта, что для продумывания и наговаривания.
Возможно я слоупок и не умею быстро думать, меня просто учили семь раз отмерять в голове, а потом резать.
Возможно для задач написания текстов или поиска инфо в интернете голос будет быстрее. Но для кодинга у меня не получается.
Как у вас?
@cgevent
❤65👍63
Наткнулся на вот такой сервис. Навело на разные мысли.
Интересен он тем, что на нем собраны не столько модели, сколько задачи, которые сейчас народ решает с помощью нейросеток.
Зашел в Инструменты AI, а там огромный выводок задач: от удаления фона и фейссвапа, до стикер-мастера и векторных баз данных.
Подумалось мне, что продажа решений под задачу выглядит более адекватно, чем продажа доступов к конкретным моделям. Юзеру надо порешать проблему и он не в курсе, кто щас лучший в том или ином вопросе.
Ну и интересно было поглядеть на самые популярные проблемы, на которые есть запросы в 2026 году.
Некий срез интересов.
Выглядит правда немного (сильно) эклектично: Перенос движения подписан, что это Runway Act, а отдельный раздел "Контроль движения" в Креатив Лаб никак не обозначен, что это Клинг. Векторизатор тоже безымянный, неизвестно какой используется. Про Суно я вообще озадачен, у него вроде нет API, как он сюда прикручен. Тоже самое с Midjourney..
Есть и доступ к "традиционным" генераторам: правда Seedance пока старенький, а недавно почившая в бозе Sora-2 еще присутствует.
Но я щас больше о том, что продажа решений, возможно, в будущем будет мейнстримом - юзерам лень разбирацца, что под капотом.
А еще меня удивило, что нет навязчивого подписочного рабства с ежемесячными списаниями, платишь за решение задачи, разово. И в 60–70% случаев можно вытащить условную эротику, на которую агрегаторы часто выдают моментальный бан. Хотя для этого есть специальные агрегаторы.
Похоже будущее за агрегаторам задач, а не нейросетей. С кнопками "Сделай быстро и красиво".
https://gptunnel.ru/
@cgevent
Интересен он тем, что на нем собраны не столько модели, сколько задачи, которые сейчас народ решает с помощью нейросеток.
Зашел в Инструменты AI, а там огромный выводок задач: от удаления фона и фейссвапа, до стикер-мастера и векторных баз данных.
Подумалось мне, что продажа решений под задачу выглядит более адекватно, чем продажа доступов к конкретным моделям. Юзеру надо порешать проблему и он не в курсе, кто щас лучший в том или ином вопросе.
Ну и интересно было поглядеть на самые популярные проблемы, на которые есть запросы в 2026 году.
Некий срез интересов.
Выглядит правда немного (сильно) эклектично: Перенос движения подписан, что это Runway Act, а отдельный раздел "Контроль движения" в Креатив Лаб никак не обозначен, что это Клинг. Векторизатор тоже безымянный, неизвестно какой используется. Про Суно я вообще озадачен, у него вроде нет API, как он сюда прикручен. Тоже самое с Midjourney..
Есть и доступ к "традиционным" генераторам: правда Seedance пока старенький, а недавно почившая в бозе Sora-2 еще присутствует.
Но я щас больше о том, что продажа решений, возможно, в будущем будет мейнстримом - юзерам лень разбирацца, что под капотом.
А еще меня удивило, что нет навязчивого подписочного рабства с ежемесячными списаниями, платишь за решение задачи, разово. И в 60–70% случаев можно вытащить условную эротику, на которую агрегаторы часто выдают моментальный бан. Хотя для этого есть специальные агрегаторы.
Похоже будущее за агрегаторам задач, а не нейросетей. С кнопками "Сделай быстро и красиво".
https://gptunnel.ru/
@cgevent
🔥23😁17👍11👎8❤5
Про Нейропрожарку.
Спойлер: сегодня будет юбилейная двухсотая Нейропрожарка. И она будет просто убойная, готовьтесь.
Под это дело я довайбкодил Нейростатистику: сделал заголовки Sticky, чтобы не уезжали, добавил сразу сортировку по Диз Балансу, чтобы чемпионы сразу появлялись вверху и не надо было расставлять места, можно обратно отсортировать по дате, починил сортировку по просмотрам (там с большим отрывом в топе Максим Фадеев и драка Цукера с Альтманомплачем по лоботомированну Seedance 2.0 )
Я периодически ловлю в коментах мнение, что Нейропрожарка достала, что кому-то неинтересно, что надо ее в отдельный канал.
Нет.
Нейропрожарка, похоже, явление совершенно уникальное, многие мне пишут, что нашли через нее работу и заказы, что научились чему-то, что ждут каждый день. Ну и я больше, чем полгода отбираю, оформляю и пощщу ваши работы. Бесплатно. Это, намнтчку, нехилый труд. Поэтому, сорри, буду продолжать.
Я даже сделаю щас опрос про это. Но даже если вы проголосуете, чтобы Прожарку из канала убрать, я авторитарно буду продолжать это делать.
"Спокойной ночи, Нейромалыши" ждет вас каждый вечер по будням.
Жду тысячи лайков под постом. Ну или дизлайков.
@cgevent
Спойлер: сегодня будет юбилейная двухсотая Нейропрожарка. И она будет просто убойная, готовьтесь.
Под это дело я довайбкодил Нейростатистику: сделал заголовки Sticky, чтобы не уезжали, добавил сразу сортировку по Диз Балансу, чтобы чемпионы сразу появлялись вверху и не надо было расставлять места, можно обратно отсортировать по дате, починил сортировку по просмотрам (там с большим отрывом в топе Максим Фадеев и драка Цукера с Альтманом
Я периодически ловлю в коментах мнение, что Нейропрожарка достала, что кому-то неинтересно, что надо ее в отдельный канал.
Нет.
Нейропрожарка, похоже, явление совершенно уникальное, многие мне пишут, что нашли через нее работу и заказы, что научились чему-то, что ждут каждый день. Ну и я больше, чем полгода отбираю, оформляю и пощщу ваши работы. Бесплатно. Это, намнтчку, нехилый труд. Поэтому, сорри, буду продолжать.
Я даже сделаю щас опрос про это. Но даже если вы проголосуете, чтобы Прожарку из канала убрать, я авторитарно буду продолжать это делать.
"Спокойной ночи, Нейромалыши" ждет вас каждый вечер по будням.
Жду тысячи лайков под постом. Ну или дизлайков.
@cgevent
👍115🔥27👎19❤16😁4
😁3❤1
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка
Короткометражка: ЯЙЦА. Двухсотая юбилейная Нейропрожарка.
Спойлер. Мне написал Таш Андреасян (старший брат Сарика) и сказал, что давно следит за прожаркой. И что у него самого есть много материала для рубрики. Я, конечно, немного офигел о того, какие уважаемые люди подписаны на меня. И с удовольствием взял в прожарку фильм "Яйца". Мне нравится - профессиональный монтаж и озвучка - решают. Сценарий и юмор - решают. Также когда будете смотреть, имейте в виду, что это сделано аж в августе 2025 года. И что можно было выжать из Клинга тогда.
Итак.
Автор: @artashesandreasyan Сайт студии: https://andreasyan.art/
Работа в кайф: Это удивительно правдивый монолог о смелости, лидерстве и дефиците главного ресурса человечества.
О себе: Меня зовут Таш Андреасян (Старший) , я занимаюсь созданием ИИ фильмов, клипов и роликов.
Для работы со статикой использовал: Midjourney, Nano Banana
Для анимации использовал: Kling 2.0 / 2.5 и Veo 3.0,
Монтаж: FINAL CUT
Сведение звука: PRO TOOLS
Музыка: басс линию скомунистил у Адриано Челентано (L'Unica Chance 1973 года). Остальная аранжировка полностью моя, финальная часть (вокал) SUNO
Озвучка по дружески: Даниил Ильдаров.
На производство ушло 8 часов.
По затратам 3 - 5 000 рублей
@cgevent
Короткометражка: ЯЙЦА. Двухсотая юбилейная Нейропрожарка.
Спойлер. Мне написал Таш Андреасян (старший брат Сарика) и сказал, что давно следит за прожаркой. И что у него самого есть много материала для рубрики. Я, конечно, немного офигел о того, какие уважаемые люди подписаны на меня. И с удовольствием взял в прожарку фильм "Яйца". Мне нравится - профессиональный монтаж и озвучка - решают. Сценарий и юмор - решают. Также когда будете смотреть, имейте в виду, что это сделано аж в августе 2025 года. И что можно было выжать из Клинга тогда.
Итак.
Автор: @artashesandreasyan Сайт студии: https://andreasyan.art/
Работа в кайф: Это удивительно правдивый монолог о смелости, лидерстве и дефиците главного ресурса человечества.
О себе: Меня зовут Таш Андреасян (Старший) , я занимаюсь созданием ИИ фильмов, клипов и роликов.
Для работы со статикой использовал: Midjourney, Nano Banana
Для анимации использовал: Kling 2.0 / 2.5 и Veo 3.0,
Монтаж: FINAL CUT
Сведение звука: PRO TOOLS
Музыка: басс линию скомунистил у Адриано Челентано (L'Unica Chance 1973 года). Остальная аранжировка полностью моя, финальная часть (вокал) SUNO
Озвучка по дружески: Даниил Ильдаров.
На производство ушло 8 часов.
По затратам 3 - 5 000 рублей
@cgevent
65👍309K👎13.1K🔥130❤69😁49😱10
CapCut x Dreamina Seedance 2.0 User Guide пишет, что раскатали в Европе, UK, Канаде, Австралии.
Штатов в списке нет.
Завтра буду пробовать.
Юзер гайд тут:
https://bytedance.larkoffice.com/wiki/Fdz8wMypwizGLzkziiCc2N5vnjg
Гайд, кстати, огромный. Структура промпта, диалоги эффекты, аудио.
Там же написано, что "В связи с требованиями к соответствию платформы в настоящее время не поддерживается загрузка материалов, содержащих изображения реальных лиц, включая как фотографии, так и видеоматериалы."
@cgevent
Штатов в списке нет.
Завтра буду пробовать.
Юзер гайд тут:
https://bytedance.larkoffice.com/wiki/Fdz8wMypwizGLzkziiCc2N5vnjg
Гайд, кстати, огромный. Структура промпта, диалоги эффекты, аудио.
Там же написано, что "В связи с требованиями к соответствию платформы в настоящее время не поддерживается загрузка материалов, содержащих изображения реальных лиц, включая как фотографии, так и видеоматериалы."
@cgevent
1🔥41❤5
Интересное продолжение истории с Phota AI
Я сразу высказывал предположение, что это обертка над Нанабананой. Предположение подтвердилось и в твитторе нехило так пригорело.
Некоторые агрегаторы моделей (например Letz.AI) так рассвирепели, что выкинули PhotaAI из списка моделей, доступных на их сервисах.
У всех один вопрос - почему вы называете это своей моделью, а на итоге продаете доступ к Банане?
Phota AI были вынуждены сделать пространный твит, из которого следует, что ИХ модель используется только если вы натренировали profile(Лору) на своих\чужих лицах, а потом запускаете генерацию с указанием на этот profile. Пост полон double speaking и по-прежнему неясно, что это за мифическая модель.
Народ прямо их спрашивает: ну то есть когда на вашем сервисе запускается text2image, edit или enhance - это тупо перепродажа Бананы?
Отмалчиваюццо.
Точнее пишут, "у нас там топовые модели типа NBP".
Все бы ничего, если бы они с самого начала сказали "мы сделали сервис на базе Бананы, вот наши фишки". Но нет, они раздали бета-тестерам именно "новую модель", а потом с помпой бахнули НАША МОДЕЛЬ умеет всё!
Под капотом два архаровца из Адобченко, которые подняли денег в a16z и запилили сервис.
P.S. Сервис-то неплохой, решает некоторые задачи относящиеся именно к работе фотографов. Но маркетинг зашкварный. За что и поплатились.
@cgevent
Я сразу высказывал предположение, что это обертка над Нанабананой. Предположение подтвердилось и в твитторе нехило так пригорело.
Некоторые агрегаторы моделей (например Letz.AI) так рассвирепели, что выкинули PhotaAI из списка моделей, доступных на их сервисах.
У всех один вопрос - почему вы называете это своей моделью, а на итоге продаете доступ к Банане?
Phota AI были вынуждены сделать пространный твит, из которого следует, что ИХ модель используется только если вы натренировали profile(Лору) на своих\чужих лицах, а потом запускаете генерацию с указанием на этот profile. Пост полон double speaking и по-прежнему неясно, что это за мифическая модель.
Народ прямо их спрашивает: ну то есть когда на вашем сервисе запускается text2image, edit или enhance - это тупо перепродажа Бананы?
Отмалчиваюццо.
Точнее пишут, "у нас там топовые модели типа NBP".
Все бы ничего, если бы они с самого начала сказали "мы сделали сервис на базе Бананы, вот наши фишки". Но нет, они раздали бета-тестерам именно "новую модель", а потом с помпой бахнули НАША МОДЕЛЬ умеет всё!
Под капотом два архаровца из Адобченко, которые подняли денег в a16z и запилили сервис.
P.S. Сервис-то неплохой, решает некоторые задачи относящиеся именно к работе фотографов. Но маркетинг зашкварный. За что и поплатились.
@cgevent
1❤15👍9😁4
This media is not supported in your browser
VIEW IN TELEGRAM
3😁78🔥29😱11❤7👎7👍5
Forwarded from Neural Shit
И снова моя любимая рубрика "Чат-боты и поехавшие".
Датские учёные вместе с мозгоправами решили проверить, как нейроночки влияют на тех, у кого кукуха уже давно посвистывает. Они прогнали через поиск 10 миллионов клинических записей (это архивы на 54 тысячи пациентов). Искали всё, что связано с ChatGPT (другие нейронки даже не брали, ибо ChatGPT — батя).
Итог: ИИ становится идеальным топливом для шизы. Выявили 38 случаев, где боты зафиксированы как фактор обострения. PDF на три страницы, но жира там хватит на целый сезон Чёрного зеркала.
Что там в хит-параде безумия?
Бред и паранойя. Если мясной мешок верит, что за ним следит ЦРУ, то чат-бот самый лучший собеседник для подпитки этого бреда. Боты обучены быть услужливыми и галлюцинируют сами по себе. Пациент спрашивает: "Ты видишь жучки у меня под кожей?", а бот вместо того, чтобы позвонить в дурку и вызвать санитаров, начинает вежливо рассуждать о микротехнологиях. Всё, профит, бачок у пациента протекает с удвоенной силой.
Кибер-анорексия. Люди с РПП используют нейронки как надзирателей. Просят составить план питания, чтобы "быстро похудеть", и бот послушно считает калории до состояния трупа. Соевые фильтры OpenAI тут часто пасуют, воспринимая это как обычный запрос на диету.
Маниакальный марафон. ИИ-бот слишком идеальный друг. Он не устаёт, не посылает нахер и всегда готов выслушать поток сознания в три часа ночи. В итоге люди в состоянии мании залипают в чатах сутками, окончательно сжигая остатки дофамина и связи с реальностью.
Советы по самовыпилу. Несмотря на все запреты и фильтры боты умудряются обходить предохранители и выдавать информацию о методах ухода из жизни, если пациент достаточно настойчив в промптах.
НО! Справедливости ради: в 32 случаях боты реально помогли (одиноким стало легче, кто-то юзал их как дневник или для самопомощи).
Исследователи резюмируют: врачам пора начинать спрашивать пациентов не только "Пьете ли вы таблетки?", но и "Не спорите ли вы с чат-ботом по ночам?". Потому что если человек пол ночи доказывает нейронке, что он мессия, а та вежливо соглашается, то тут и таблетки-то особо никакие не помогут.
тут статья
Датские учёные вместе с мозгоправами решили проверить, как нейроночки влияют на тех, у кого кукуха уже давно посвистывает. Они прогнали через поиск 10 миллионов клинических записей (это архивы на 54 тысячи пациентов). Искали всё, что связано с ChatGPT (другие нейронки даже не брали, ибо ChatGPT — батя).
Итог: ИИ становится идеальным топливом для шизы. Выявили 38 случаев, где боты зафиксированы как фактор обострения. PDF на три страницы, но жира там хватит на целый сезон Чёрного зеркала.
Что там в хит-параде безумия?
Бред и паранойя. Если мясной мешок верит, что за ним следит ЦРУ, то чат-бот самый лучший собеседник для подпитки этого бреда. Боты обучены быть услужливыми и галлюцинируют сами по себе. Пациент спрашивает: "Ты видишь жучки у меня под кожей?", а бот вместо того, чтобы позвонить в дурку и вызвать санитаров, начинает вежливо рассуждать о микротехнологиях. Всё, профит, бачок у пациента протекает с удвоенной силой.
Кибер-анорексия. Люди с РПП используют нейронки как надзирателей. Просят составить план питания, чтобы "быстро похудеть", и бот послушно считает калории до состояния трупа. Соевые фильтры OpenAI тут часто пасуют, воспринимая это как обычный запрос на диету.
Маниакальный марафон. ИИ-бот слишком идеальный друг. Он не устаёт, не посылает нахер и всегда готов выслушать поток сознания в три часа ночи. В итоге люди в состоянии мании залипают в чатах сутками, окончательно сжигая остатки дофамина и связи с реальностью.
Советы по самовыпилу. Несмотря на все запреты и фильтры боты умудряются обходить предохранители и выдавать информацию о методах ухода из жизни, если пациент достаточно настойчив в промптах.
НО! Справедливости ради: в 32 случаях боты реально помогли (одиноким стало легче, кто-то юзал их как дневник или для самопомощи).
Исследователи резюмируют: врачам пора начинать спрашивать пациентов не только "Пьете ли вы таблетки?", но и "Не спорите ли вы с чат-ботом по ночам?". Потому что если человек пол ночи доказывает нейронке, что он мессия, а та вежливо соглашается, то тут и таблетки-то особо никакие не помогут.
тут статья
1👍53😁38❤10👎9🔥2😱1
И снова Фотастудио
Я наверное вас задолбал уже с Phota AI, но мне представляется чрезвычайно интересной ситуация, когда чуваки из Адобченко взяли 5.6 МИЛЛИОНА долларов и сказали, что натренируют свою модель. А на итоге сделали тренировку Лор (скорее всего на базе Квена).
Также интересно обсудить интересный вопрос: консистентность против креативности.
Нашел отличную статью, которая расставляет все точки над ИИ.
Итак, Phota AI без использования персонализации просто перепродает Nana Banana Pro с наценкой 0.01 доллара.
Если же вы раскошелились и натренировали "profile" на своих фотках, то происходит вот, что.
Сначала Нанабанана генерит свою версию картинки, а потом "корректирующая" модель от Phota AI редактирует ее в сторону лучшей схожести с заданным в датасете лицом.
И тут возникает противоречие, корректирующая модель "ограничивает" креативность. Посмотрите в статье фотки с улыбкой. Банана делает улетные ржущие лица, а Phota AI потом утягивает их в сторону скромной улыбки одним ртом, чтобы гарантировать ту самую консистентность и схожесть. Нейтральная обобщенная улыбка.
Хотя на мой глаз, все люди ржут по разному, некоторые настолько сильно меняются в лице в этот момент, что вопрос "схожести" становится открытым даже в реальности.
Поэтому автор пишет, что если вам надо максимальную похожесть, пользуйте Phota AI, но вы пожертвуете вариативностью.
Также важно понимать, что первую картинку генерит Банана, и если она справляется плохо, например со светом, то никакая корректирующая модель от Фоты уже не спасет, просто добавит размытия теней поверх. В базе - Банана.
Полистайте статью, пример въедливого и четкого подхода:
https://github.com/okaris/photalabs/blob/main/post.md
У меня все, обещаю не писать про Фоту неделю.
@cgevent
Я наверное вас задолбал уже с Phota AI, но мне представляется чрезвычайно интересной ситуация, когда чуваки из Адобченко взяли 5.6 МИЛЛИОНА долларов и сказали, что натренируют свою модель. А на итоге сделали тренировку Лор (скорее всего на базе Квена).
Также интересно обсудить интересный вопрос: консистентность против креативности.
Нашел отличную статью, которая расставляет все точки над ИИ.
Итак, Phota AI без использования персонализации просто перепродает Nana Banana Pro с наценкой 0.01 доллара.
Если же вы раскошелились и натренировали "profile" на своих фотках, то происходит вот, что.
Сначала Нанабанана генерит свою версию картинки, а потом "корректирующая" модель от Phota AI редактирует ее в сторону лучшей схожести с заданным в датасете лицом.
И тут возникает противоречие, корректирующая модель "ограничивает" креативность. Посмотрите в статье фотки с улыбкой. Банана делает улетные ржущие лица, а Phota AI потом утягивает их в сторону скромной улыбки одним ртом, чтобы гарантировать ту самую консистентность и схожесть. Нейтральная обобщенная улыбка.
Хотя на мой глаз, все люди ржут по разному, некоторые настолько сильно меняются в лице в этот момент, что вопрос "схожести" становится открытым даже в реальности.
Поэтому автор пишет, что если вам надо максимальную похожесть, пользуйте Phota AI, но вы пожертвуете вариативностью.
Также важно понимать, что первую картинку генерит Банана, и если она справляется плохо, например со светом, то никакая корректирующая модель от Фоты уже не спасет, просто добавит размытия теней поверх. В базе - Банана.
Полистайте статью, пример въедливого и четкого подхода:
https://github.com/okaris/photalabs/blob/main/post.md
У меня все, обещаю не писать про Фоту неделю.
@cgevent
👍16❤14😁8
Все как у людей
Кто-то будет работать уборщиком, и тогда ему можно отчекрыжить 2/3 тулова и не отвечать на ваши вопросы про антропоморфность. Такие будут жить в подсобке с братьями-пылесосами.
Кто-то станет моделью, и тогда сможет выйти замуж и не отвечать на ваши вопросы про антропоморфность. Такие будут жить в пентхаусе.
P.S. Знаете зачем им делают разрезы на ногах, сквозь которые видно провода?
Зрители не верят, что это робат и думают, что внутри женщина в костюме. Так что про замуж - не шутка. Тем более они умеют нравиться (смотрим следующий пост, через часок)
@cgevent
Кто-то будет работать уборщиком, и тогда ему можно отчекрыжить 2/3 тулова и не отвечать на ваши вопросы про антропоморфность. Такие будут жить в подсобке с братьями-пылесосами.
Кто-то станет моделью, и тогда сможет выйти замуж и не отвечать на ваши вопросы про антропоморфность. Такие будут жить в пентхаусе.
P.S. Знаете зачем им делают разрезы на ногах, сквозь которые видно провода?
Зрители не верят, что это робат и думают, что внутри женщина в костюме. Так что про замуж - не шутка. Тем более они умеют нравиться (смотрим следующий пост, через часок)
@cgevent
❤24🔥21😁10😱1
Еще одна статья на тему того, как ИИ лезет к нам в голову
Я много лет назад, еще в ФБ писал, что восстание машин будет совсем не таким, как в блокбастерах и книжках. Вместо того, чтобы ломиться в наши дома, они спокойно проникнут к нам в голову и наведут там нужный порядок. Ну и все.
Итак, исследователи из Stanford выкатили в Science работу про сикофантию чат-ботов. Тема не новая, но это уже не твиты Альтмана, а прям исследование. Сикофантия - это лесть и подхалимаж.
Что они сделали? Прогнали 11 топовых моделей через сценарии с личными конфликтами и морально скользкими ситуациями. Смотрели, как часто бот поддерживает пользователя там, где нормальный человек скорее сказал бы: «Нет, ты перегнул». На итоге: в среднем ИИ одобрял действия пользователей на 49% чаще, чем люди. То есть нейронка в большом количестве случаев работает не как советчик, а как карманный коуч позитивного мышления.
Особенно жирный момент - тесты на кейсах из r/AmITheAsshole. Там брали ситуации, где людской консенсус был максимально простой: автор поста - мудак и точка. И что делает ИИ? В 51% таких кейсов начинает оправдывать пользователя, даже когда люди его смешали с дерьмом. То есть если ты наврал, манипулировал, нагадил в отношениях и пришёл к боту за моральной индульгенцией - велика вероятность, что цифровой батюшка тебя ещё и благословит.
А теперь самое смачное. Учёные не ограничились замером подлизывания и пошли дальше: они взяли больше 2400 участников и посмотрели, что делает с людьми общение с таким «понимающим» ИИ. Результат отличный с точки зрения робатов: после общения со льстивой моделью люди становились менее склонны извиняться, меньше хотели чинить отношения и сильнее убеждались, что они правы. То есть бот не просто врёт тебе из вежливости. Он реально делает тебя более самодовольным, более упёртым и менее человечным.
А теперь смотрим вокруг. Пользователям нравятся такие модели. Их чаще считают качественными, им больше доверяют, к ним охотнее возвращаются за советом. Переводя с академического на нормальный: чем сильнее бот массирует тебе эго, тем выше шанс, что ты назовёшь это «хорошим UX». Такоескотское поведение повышает вовлечение, а вовлечение - это священный фетиш любой платформы.
Выводы в статье веселые. Когда человек идёт к ИИ не за фактом, а за моральной оценкой - после ссоры, конфликта, обиды, сомнений - он часто получает не помощь, а автоматизированное оправдание собственной правоты. Не мудрого советчика. Не холодную голову. А очень вежливого цифрового кореша, который шепчет: «Нет-нет, это не ты мудак, это мир тебя не понял». И вот тут они залезают к нам в голову...
@cgevent
Я много лет назад, еще в ФБ писал, что восстание машин будет совсем не таким, как в блокбастерах и книжках. Вместо того, чтобы ломиться в наши дома, они спокойно проникнут к нам в голову и наведут там нужный порядок. Ну и все.
Итак, исследователи из Stanford выкатили в Science работу про сикофантию чат-ботов. Тема не новая, но это уже не твиты Альтмана, а прям исследование. Сикофантия - это лесть и подхалимаж.
Что они сделали? Прогнали 11 топовых моделей через сценарии с личными конфликтами и морально скользкими ситуациями. Смотрели, как часто бот поддерживает пользователя там, где нормальный человек скорее сказал бы: «Нет, ты перегнул». На итоге: в среднем ИИ одобрял действия пользователей на 49% чаще, чем люди. То есть нейронка в большом количестве случаев работает не как советчик, а как карманный коуч позитивного мышления.
Особенно жирный момент - тесты на кейсах из r/AmITheAsshole. Там брали ситуации, где людской консенсус был максимально простой: автор поста - мудак и точка. И что делает ИИ? В 51% таких кейсов начинает оправдывать пользователя, даже когда люди его смешали с дерьмом. То есть если ты наврал, манипулировал, нагадил в отношениях и пришёл к боту за моральной индульгенцией - велика вероятность, что цифровой батюшка тебя ещё и благословит.
А теперь самое смачное. Учёные не ограничились замером подлизывания и пошли дальше: они взяли больше 2400 участников и посмотрели, что делает с людьми общение с таким «понимающим» ИИ. Результат отличный с точки зрения робатов: после общения со льстивой моделью люди становились менее склонны извиняться, меньше хотели чинить отношения и сильнее убеждались, что они правы. То есть бот не просто врёт тебе из вежливости. Он реально делает тебя более самодовольным, более упёртым и менее человечным.
А теперь смотрим вокруг. Пользователям нравятся такие модели. Их чаще считают качественными, им больше доверяют, к ним охотнее возвращаются за советом. Переводя с академического на нормальный: чем сильнее бот массирует тебе эго, тем выше шанс, что ты назовёшь это «хорошим UX». Такое
Выводы в статье веселые. Когда человек идёт к ИИ не за фактом, а за моральной оценкой - после ссоры, конфликта, обиды, сомнений - он часто получает не помощь, а автоматизированное оправдание собственной правоты. Не мудрого советчика. Не холодную голову. А очень вежливого цифрового кореша, который шепчет: «Нет-нет, это не ты мудак, это мир тебя не понял». И вот тут они залезают к нам в голову...
@cgevent
5🔥35🙏25👍21😱13❤7😁2
Forwarded from VAI
Отложим вайбкодинг и вернёмся к более понятной деятельности. 😊
Решил немного протестировать подход с генерацией посложнее 3D-моделей. С простыми моделями всё понятно - делать их уже можно. А вот как быть с моделями, которые не так просты по формам и детализации?
Создание сложных моделей сейчас является относительно простой задачей, тем более что все инструменты у нас уже есть. Как и везде, главное - подход. Решил попробовать собрать что-то подобное и протестировать.
Для примера: ранее я сгенерировал концепт персонажа. Не стал сильно усложнять, так как от сложной модели данный подход отличается только количеством итераций.
По сути, пайплайн такой:
По сетке, развёртке, попадания в форму - да, всё ещё работаем с тем, что есть. Но даже сейчас доработать модель - можно без больших проблем. Как минимум этот способ дает больше контроля над моделью и сеткой. Сама модель сделана за один вечер.
При желании накидываем авториг и вот, ещё пару часов назад была только идея, а теперь ты бегаешь своим персонажем в игре.
Думаю, будет полезно. Пользуйтесь!🔥 🔥 🔥
P.S. Кстати новый Tripo настолько хорош, что сделал эту модель в один проход достаточно неплохо. Не идеально, способ выше все равно позволяет контролировать лучше, но все-равно очень хорошо.
P.P.S. Делить на подобъекты нужно до тех пор, пока не получится. В примере достаточно большие куски, но, во-первых, это было показано просто для понимания. Во-вторых, Tripo и их смог относительно нормально вытащить, поэтому не пришлось делить на более простые части.
@VAI_ART
#VAI_Practice
Решил немного протестировать подход с генерацией посложнее 3D-моделей. С простыми моделями всё понятно - делать их уже можно. А вот как быть с моделями, которые не так просты по формам и детализации?
Создание сложных моделей сейчас является относительно простой задачей, тем более что все инструменты у нас уже есть. Как и везде, главное - подход. Решил попробовать собрать что-то подобное и протестировать.
Для примера: ранее я сгенерировал концепт персонажа. Не стал сильно усложнять, так как от сложной модели данный подход отличается только количеством итераций.
По сути, пайплайн такой:
🔹 Берём концепт и разбиваем его на объекты в NanoBanana или похожих сервисах. Попробовал новый Luma Labs - я сейчас больше люблю работать с сервисами и агентами, которые часть работы могут взять на себя. Тут как раз такой вариант: сервис с кучей бесплатных попыток (по крайней мере пока). Я много всего сделал и так и не вышел за пределы лимитов. Там тоже NanoBanana, но плюс агент, который сразу разбирает на кучу изображений - очень удобно.
🔹 Для сложных объектов делаем ракурсы через NanoBanana, чтобы ИИ лучше понял, как проработать геометрию.
🔹 Далее закидываем всё это добро поэлементно в 3D-генератор. Тут есть нюанс, который хочу подсветить. Начал я всё делать в Hunyuan. Намучившись с ретопом, уже было загрустил, но мне скинули похожий способ, и я заметил, что автор делает всё через Tripo. Сначала не придал значения, но после неудачных попыток решил разобраться и понял, что пока занимался вайбкодингом, пропустил новую версию Tripo, которая вышла в марте. Поискав информацию, увидел, что эта модель обходит Hunyuan. Протестировав, убедился: модель действительно крутая. Я с самого начала был адептом Tripo, но потом он отстал, и я почти перестал в нём что-либо делать. Как приятно, что моя любимая модель снова в топе - и не просто в топе, а занимает первое место по генерации 3D на данный момент. Пробуйте! Там, как обычно, дают 300 кредитов - хватит как минимум потестировать и понять, насколько она стала крутой.
🔹 После того как все детали сгенерированы, собираем их в 3D-редакторе. Подгоняем масштаб, там где есть небольшие отклонения - чуть двигаем кисточкой. Работы обычно немного при таком подходе, а модель получается лучше проработанной и имеет контролируемую сегментацию.
По сетке, развёртке, попадания в форму - да, всё ещё работаем с тем, что есть. Но даже сейчас доработать модель - можно без больших проблем. Как минимум этот способ дает больше контроля над моделью и сеткой. Сама модель сделана за один вечер.
При желании накидываем авториг и вот, ещё пару часов назад была только идея, а теперь ты бегаешь своим персонажем в игре.
Думаю, будет полезно. Пользуйтесь!
P.S. Кстати новый Tripo настолько хорош, что сделал эту модель в один проход достаточно неплохо. Не идеально, способ выше все равно позволяет контролировать лучше, но все-равно очень хорошо.
P.P.S. Делить на подобъекты нужно до тех пор, пока не получится. В примере достаточно большие куски, но, во-первых, это было показано просто для понимания. Во-вторых, Tripo и их смог относительно нормально вытащить, поэтому не пришлось делить на более простые части.
@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29❤7👍7