Метаверсище и ИИще

Вот мы все посмотрели трансляцию Гугла, где нам показывали голосового ассистента.
Те, кто не посмотрел, включают 17 минутное саммари на ютюбе тут:
https://youtu.be/MzHCWZB5ZpE
И идут на 2:37 и смотрят в правый нижний угол.

Wtf is "audio has been pre-generated" ???

Кто-то может объяснить или гугл как обычно?

👎31🔥16👍2

6.82K viewsSergey Tsyptsyn ️️, edited 21:21

Метаверсище и ИИще

Тут в комментах случился спонтанный челлендж.
Подписчил скормил в Гемини вот такую фотку и спросил его, что тут необычного. ИИ ответил, что все норм.
Коллеги стали кормить фото в chatGPT и Клод, но те тоже не нашли криминала.

Я сам спросонья долго глядел на фото, как баран, но тоже ничего такого не увидел. Многие кожаные подписчики из чата тоже ничего не нашли.

И тут пошли коменты, что "после наводящих вопросов" все ИИ стали давать правильный ответ.

Если я задам такой вопрос, вы тоже сразу увидите(если ещё не увидели, не все такие тупые, как я).

Подсказка - на втором скрине, переписка с chatGPT. Но вы помучайтесь сами для начала.

Это я к чему?

ВСЕ КАК У ЛЮДЕЙ. ВСЕ КАК У ЛЮДЕЙ.

👍86🔥28

7.11K viewsSergey Tsyptsyn ️️, 08:09

Метаверсище и ИИще

StabilityAI - всё?
SD3, веса и вот это вот всё - всё?

Ищут покупателя при оценке в 100 миллионов.

Маск? Адобченко? Метачка?
https://the-decoder.com/stability-ai-reportedly-runs-out-of-money-and-in-negotiations-to-sell/

👍16👎10🔥3

6.67K viewsSergey Tsyptsyn ️️, 12:10

Метаверсище и ИИще

Вопрос: кто пользовался "оживляторами" голоса?
Не войс-клонинг, а добавление эмоций(немного) в существующий аудиотрек с речью спикера или интервью.
Бьютификация существующего голоса в общем.
Есть решения?

👍12

6.26K viewsSergey Tsyptsyn ️️, edited 13:52

Метаверсище и ИИще

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

~~Рендер или видео?~~

Задорный какой!
Понятно, что рендер. Вопрос, кто постарался?

Wonder Dynamics?
Simulon?
Viggle?

Понятно, что трекинг уезжает, но для тиктока отлично просто.

А крупные каналы щас запостят бедолагу с заголовками "киберпанк уже здесь" и "новая китайская модель робота для закусочных".

Однокнопочный композ все ближе.

👍61👎11

7.43K viewsSergey Tsyptsyn ️️, edited 14:17

Метаверсище и ИИще

Грег Брокман, президент OpenAI, дразнит всех в твитторе вот такой картинкой.
Это генерация в GPT-4o, только не в нынешней, которая умеет только в текст, а в будущей, которая мульти модальная и пока недоступная (как и голосовая с презентации).

То, что это генерация, можно понять сильно зазумившись на шею и правую руку.

Но если не зумиться, то можно слегка охренеть.

И поскольку Стабилити явно тонет, то я, наверное, вычеркну SD3 из списка ожидания(пока их никто не пожрал). И буду алкать DALLE-4o.

Но цензурищща там будет, конечно...
https://x.com/gdb/status/1790869434174746805

👍48

7.24K viewsSergey Tsyptsyn ️️, edited 15:55

Метаверсище и ИИще

А тем временем битва за данные продолжается.

Я уже писал, что открытие gpt-4o для всех, это, прежде всего, охота за новыми данными, данными для обучения. Которые юзеры будут вливать в жерло ИИ своими неистовыми промптами, картинками, видосами и диалогами.

Тут уже прошла новость о том, что OpenAI запартнерился с со StackOverflow, для которых это прям хорошая сделка, ибо с появлением ИИ, пишущего код, трафик на их сайте просел на 47%. Правда, подобно художниками, некоторые кожаные программеры взорали: "а чо это этот тупой ИИ учится на нашем коде, мы на такое не подписывались". И ну портить код в своих аккаунтах. В общем, все как у людей.

А сейчас вот OpenAI удачно подписали соглашение в Реддитом. Ведь с реддита все и начиналось, их ранние модели GPT-x обучались на данных с Реддита (неофициально как бы). И Реддит - это прям Клондайк для данных - отборное кожаное общение без прикрас и цензуры.

Данные новая нефть, банально уже до коликов, но факт. И источник хороших доходов. Кто бы мог подумать, что все эти глупости, которые мы изрыгаем в сеть, все эти нарциссические картинки и неумные комментарии будут так цениться на рынке в 2024 году.
https://openai.com/index/openai-and-reddit-partnership/

Аптдейт. Маск тем временем, пришел в 4Chan и подписался с ними на использование всего этого ада для Grok.

Openai

OpenAI and Reddit Partnership

OpenAI and Reddit Partnership
We’re bringing Reddit’s unique content to ChatGPT and our products.

👍45🔥18

6.67K viewsSergey Tsyptsyn ️️, edited 08:44

Метаверсище и ИИще

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

Хуньянь: новый генератор картинко от ТикТока, с весами и кодом.
Прежде чем восторженно перепащивать, читаем следующий пост.

👍9

5.69K viewsSergey Tsyptsyn ️️, edited 09:41

Метаверсище и ИИще

Хуньянь: Китайский генератор картинок от ТикТока. С весами и пирогами.

Коль скоро SD3 мы увидим примерно никто не знает когда, то смотрим, вокруг.
ТикТок выкатил свою модель. С кодом и весами.
Ну и конечно по их китайским тестам она бьет весь опенсорс (включая SD3), скромно уступая Midjourney и DALL·E 3.

Но мы ж не просто перепащиваем новости и визжим от черрипикнутых картинок с их сайта.

Лезем в демо и тестируем. Расчехляем промпт с принцессой.
Они делают акцент на улучшенное понимание китайского языка. Тут мне похвастаться нечем, я погонял на английском.

И да, там есть Prompt Enhancement, как в фооокусе, добавление текстовой красоты в промпт. Работает забавно. Но мыло не убирает.
Три сэмплера, третий не работает.

На итоге: уровень SD2 или SD1.5. Сильное мыло, беда с руками, постоянно сваливается в аниме. Возможно если бы были крутилки, можно что-то докрутить, но в демо нет никаких крутилок.
Можно поставить локально, может быть там будет больше параметров.

Он совершенно не умеет в людей, но на всяких узорах и декорах ведет себя пристойно, даже мылит меньше. Похоже на первый firefly.

Для тех, кто в NSFW - очень забавная цензура. Промпт не отвергает, но пытается укутать картинку хотя бы в белье. Постоянно сваливается в аниме, от греха подальше. Когда добиваешь негативным промтом, изорачиваетя. Мылит соски, прячет детали. Похоже на поведение SDXL.

Все явки и пароли тут:
https://github.com/Tencent/HunyuanDiT

Потестируйте, может у вас китайский хороший...

👍24👎1

6.67K viewsSergey Tsyptsyn ️️, 09:48

Метаверсище и ИИще

Ну и вишенка на китайском торте.

Если включаешь Prompt Enhancement, то она из стройной девушки на лугу, делает вот такой вариант. Типа добавляет новой нормальной красоты. С одним и тем же сидом и промптом.
Диверсити, блин. И до Китая добралось.

Подробнее в предыдущем посте.

🔥45👎15👍3

6.22K viewsSergey Tsyptsyn ️️, 09:52

About

Blog

Apps

Platform