Метаверсище и ИИще
46.8K subscribers
5.93K photos
4.35K videos
45 files
6.82K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Вот мы все посмотрели трансляцию Гугла, где нам показывали голосового ассистента.
Те, кто не посмотрел, включают 17 минутное саммари на ютюбе тут:
https://youtu.be/MzHCWZB5ZpE
И идут на 2:37 и смотрят в правый нижний угол.

Wtf is "audio has been pre-generated" ???

Кто-то может объяснить или гугл как обычно?
👎31🔥16👍2
Тут в комментах случился спонтанный челлендж.
Подписчил скормил в Гемини вот такую фотку и спросил его, что тут необычного. ИИ ответил, что все норм.
Коллеги стали кормить фото в chatGPT и Клод, но те тоже не нашли криминала.

Я сам спросонья долго глядел на фото, как баран, но тоже ничего такого не увидел. Многие кожаные подписчики из чата тоже ничего не нашли.

И тут пошли коменты, что "после наводящих вопросов" все ИИ стали давать правильный ответ.

Если я задам такой вопрос, вы тоже сразу увидите(если ещё не увидели, не все такие тупые, как я).

Подсказка - на втором скрине, переписка с chatGPT. Но вы помучайтесь сами для начала.

Это я к чему?

ВСЕ КАК У ЛЮДЕЙ. ВСЕ КАК У ЛЮДЕЙ.
👍86🔥28
StabilityAI - всё?
SD3, веса и вот это вот всё - всё?

Ищут покупателя при оценке в 100 миллионов.

Маск? Адобченко? Метачка?
https://the-decoder.com/stability-ai-reportedly-runs-out-of-money-and-in-negotiations-to-sell/
👍16👎10🔥3
Вопрос: кто пользовался "оживляторами" голоса?
Не войс-клонинг, а добавление эмоций(немного) в существующий аудиотрек с речью спикера или интервью.
Бьютификация существующего голоса в общем.
Есть решения?
👍12
This media is not supported in your browser
VIEW IN TELEGRAM
Рендер или видео?

Задорный какой!
Понятно, что рендер. Вопрос, кто постарался?

Wonder Dynamics?
Simulon?
Viggle?

Понятно, что трекинг уезжает, но для тиктока отлично просто.

А крупные каналы щас запостят бедолагу с заголовками "киберпанк уже здесь" и "новая китайская модель робота для закусочных".

Однокнопочный композ все ближе.
👍61👎11
Грег Брокман, президент OpenAI, дразнит всех в твитторе вот такой картинкой.
Это генерация в GPT-4o, только не в нынешней, которая умеет только в текст, а в будущей, которая мульти модальная и пока недоступная (как и голосовая с презентации).

То, что это генерация, можно понять сильно зазумившись на шею и правую руку.

Но если не зумиться, то можно слегка охренеть.

И поскольку Стабилити явно тонет, то я, наверное, вычеркну SD3 из списка ожидания(пока их никто не пожрал). И буду алкать DALLE-4o.

Но цензурищща там будет, конечно...
https://x.com/gdb/status/1790869434174746805
👍48
А тем временем битва за данные продолжается.

Я уже писал, что открытие gpt-4o для всех, это, прежде всего, охота за новыми данными, данными для обучения. Которые юзеры будут вливать в жерло ИИ своими неистовыми промптами, картинками, видосами и диалогами.

Тут уже прошла новость о том, что OpenAI запартнерился с со StackOverflow, для которых это прям хорошая сделка, ибо с появлением ИИ, пишущего код, трафик на их сайте просел на 47%. Правда, подобно художниками, некоторые кожаные программеры взорали: "а чо это этот тупой ИИ учится на нашем коде, мы на такое не подписывались". И ну портить код в своих аккаунтах. В общем, все как у людей.

А сейчас вот OpenAI удачно подписали соглашение в Реддитом. Ведь с реддита все и начиналось, их ранние модели GPT-x обучались на данных с Реддита (неофициально как бы). И Реддит - это прям Клондайк для данных - отборное кожаное общение без прикрас и цензуры.

Данные новая нефть, банально уже до коликов, но факт. И источник хороших доходов. Кто бы мог подумать, что все эти глупости, которые мы изрыгаем в сеть, все эти нарциссические картинки и неумные комментарии будут так цениться на рынке в 2024 году.
https://openai.com/index/openai-and-reddit-partnership/

Аптдейт. Маск тем временем, пришел в 4Chan и подписался с ними на использование всего этого ада для Grok.
👍45🔥18
This media is not supported in your browser
VIEW IN TELEGRAM
Хуньянь: новый генератор картинко от ТикТока, с весами и кодом.
Прежде чем восторженно перепащивать, читаем следующий пост.
👍9
Хуньянь: Китайский генератор картинок от ТикТока. С весами и пирогами.

Коль скоро SD3 мы увидим примерно никто не знает когда, то смотрим, вокруг.
ТикТок выкатил свою модель. С кодом и весами.
Ну и конечно по их китайским тестам она бьет весь опенсорс (включая SD3), скромно уступая Midjourney и DALL·E 3.

Но мы ж не просто перепащиваем новости и визжим от черрипикнутых картинок с их сайта.

Лезем в демо и тестируем. Расчехляем промпт с принцессой.
Они делают акцент на улучшенное понимание китайского языка. Тут мне похвастаться нечем, я погонял на английском.

И да, там есть Prompt Enhancement, как в фооокусе, добавление текстовой красоты в промпт. Работает забавно. Но мыло не убирает.
Три сэмплера, третий не работает.

На итоге: уровень SD2 или SD1.5. Сильное мыло, беда с руками, постоянно сваливается в аниме. Возможно если бы были крутилки, можно что-то докрутить, но в демо нет никаких крутилок.
Можно поставить локально, может быть там будет больше параметров.

Он совершенно не умеет в людей, но на всяких узорах и декорах ведет себя пристойно, даже мылит меньше. Похоже на первый firefly.

Для тех, кто в NSFW - очень забавная цензура. Промпт не отвергает, но пытается укутать картинку хотя бы в белье. Постоянно сваливается в аниме, от греха подальше. Когда добиваешь негативным промтом, изорачиваетя. Мылит соски, прячет детали. Похоже на поведение SDXL.

Все явки и пароли тут:
https://github.com/Tencent/HunyuanDiT

Потестируйте, может у вас китайский хороший...
👍24👎1
Ну и вишенка на китайском торте.

Если включаешь Prompt Enhancement, то она из стройной девушки на лугу, делает вот такой вариант. Типа добавляет новой нормальной красоты. С одним и тем же сидом и промптом.
Диверсити, блин. И до Китая добралось.

Подробнее в предыдущем посте.
🔥45👎15👍3