AINews | Нейросети
462 subscribers
760 photos
656 videos
2 files
583 links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за подкасты.
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.

Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.

Все.

Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?

Хейген, похоже, сами не понимают, как они троллят интернет.
OpenAI 7: проекты в chatgpt

Очень полезная штука. Можно такие папочки создавать, в которых все необходимые документы, инструкции, чаты. Причем не только на потрындеть, но и код пописать. Наконец-то можно будет разложить все аккуратно и контекст сохранять. Тут рабочая стратегия, тут путешествия организация и так далее. Раскатывают прямо сейчас
https://www.youtube.com/live/FcB97h3vrzk?si=xjUjA8kQxsJLMglh
Реалтаймовый path tracing в UE5.

Честно говоря, звучит как изобретение квантового рейтрейсинга или применение квантовых компьютеров для рендеринга. Ну не может такой кадр считаться в 60fps, я хорошо помню из прошлой жизни, что такие сцены считаются сутками. На кадр.

Если интересно как это возможно, поглядите видео. Как я понял, вместо миллиардов лучей испускаются миллионы(звучит иронично, но экономия в тысячи раз) и испускаются локально, только там где надо(блидинг, софт шедоу и пр).

И там хорошие три вопроса, один из которых про потерю качества при таком подходе. Ответ - ее почти нет.

Явшоке. Подробности ниже.

А я вспоминаю недавние посты про генерацию, а точнее про рендеринг игр нейронками, которые знать не знают про path tracing и физическую корректность, и думаю, а что важнее - дофамин или физически корректный свет? И где предел качества картинки, после которого пользователю уже все равно на качество?

https://youtu.be/JYI1srodjeg?si=8VxmZyglPqGCjVOa
Kandinsky Video, Gigachat Music и народный датасет.

У Кандинского вышла новая модель 4.0 для генерации видео и местами там очень неплохие результаты.

А Gigachat запустил свой генератор музыки. Длина трека полторы минуты, но есть также генератор тестов песен.

И кстати про тексты и датасеты. Сбер в 2025 году начнет собирать "Народный датасет" для обучения моделей GigaChat и Kandinsky - в нем могут поучаствовать все желающие, приведя информацию о небольших регионах, о городской специфике, малых народах или устоявшихся выражениях. Своеобразный национальный краудсорсинг информации новой модели.
Подробности тут.
Это уже AGI?

Началось?

💀👋😈👋🫢
This media is not supported in your browser
VIEW IN TELEGRAM
Grok Aurora & Kandinsky

Цензура? Нет, не слышали..

Сора: а чо так можно было?
This media is not supported in your browser
VIEW IN TELEGRAM
Pika 2.0 — мечта всех рекламщиков

Pika продолжают исследовать возможности для контроля видео и на этот раз представили Scene Ingredients.

Фича позволяет создавать видео с реальными людьми (0:37) и объектами, а затем поместить их всех в какое-то место действия. По сути, это IP-Adapter на стероидах для видео. Конечно, тут ничего на лету не обучается, просто на вход сетки подаются дополнительные эмбеддинги референсных объектов. Но это может не очень стабильно работать.

- Подписка за $35 даёт кредитов на 40 видео в месяц (это очень мало).
- За $95 можно получить уже 120 видео.

Видео с Ingredients используют в два раза больше кредитов. Так что подписки даже за 95 баксов на нормальный видос не хватит 🤭

Большой упор сделали на рекламщиков. А-ля: загрузи фотку модели и фотку какой-то вещицы — и вот держи, пожалуйста, модный промо-видосик! Но не совсем понятно, насколько это на самом будет хорошо работать и слушаться промпта.

Kling вот недавно тоже сделали шаг в этом направлении, неожиданно релизн...
Боюсь, что нигде теперь. А как ещё ИИ будет получать бесплатную разметку для беспилотников?
Любишь катацца, люби и данные метить.
Не любишь катацца, сиди на обочине прогресса.
This media is not supported in your browser
VIEW IN TELEGRAM
Адобченко пилит свой Omnigen. И какой!


https://xavierchen34.github.io/UniReal-Page/

Обещан код!

В воскресенье мне негоже писать лонгриды, поэтому я просто скопирую сюда все эти сладости, из которых меня больше всего возбудила вот эта:

Learns from video data to understand shadows, reflections, lighting effects and object interactions

Итак.

# 🌟 Key Features

* Universal Framework: Handle multiple tasks like generation, editing, customization and composition in a single model
* Real-world Dynamics: Learns from video data to understand shadows, reflections, lighting effects and object interactions
* Multi-Image Support: Process multiple input/output images seamlessly as "frames"
* Smart Context Understanding: Advanced hierarchical prompting system for precise control
* Automatic Adaptation: Intelligently adjusts to different tasks without requiring specific instructions

# 🎨 Example Applications

# Image Editing

* Add/remove objects with natural lighting and shadows
* Modify scene attributes while main...
У вас есть телевизор или стиралка LG. А еще лучше - микроволновка!

Так вот, у них теперь есть своя LLM. Рассуждающая притом и полная агентности.

LG бахнули Экзаван Дип. По метрикам побивает, как вы понимаете, всех.

"EXAONE Deep был разработан с особым акцентом на математику, естественные науки и кодирование. По своему назначению он отличается от таких общих моделей, как Gemma 3 и Mistral 3.1"

В коментах приветствуются шутки про отмывание токенов в стиралках LG и запуск на рисоварках.

Все подробности тут:
https://www.lgresearch.ai/blog/view?seq=543

P.S. Почему я избегаю многочисленных новостей про LLM? Ну потому что смотришь на сгенеренную картинку или видос и сразу видишь - говно или годно. А LLM только метриками меряются постоянно. Мой фаворит сейчас - это Грок 3. И я не очень понимаю, зачем мне Мистраль Смолл или Экзаван. Или еще одна из 15 000 LLM.