эйай ньюз

Полевой тест: Kling vs SORA

Уже начали выдавать доступ к китайской модели для генерации видео Kling (пост о ней) первым юзерам. И в твиттере уже провели ее сравнение с моделью SORA от OpenAI.

Я вижу, что SORA всё-таки генерирует более кинематографичные видео с большим количеством движения объектов и камеры. Обратите внимание, как во многих примерах камера в Kling почти статичная. Ещё, кажется, у Kling в тренировочном датасете были более простые стоковые видео, тогда как SORA тренировали на более качественных роликах.

Однако, стоит учитывать, что это сравнение не совсем честное – так как мы видим примеры Kling, сгенерированные обычным юзерами, против очень сильно черепикнутых промо-видео от SORA, бог знает за сколько попыток сгенерированных. Так что ждём честного сравнения, когда у кого-то появится доступ к обеим моделям!

@ai_newz

17.3K views08:18

эйай ньюз

Через 15 минут начнётся основная презентация WWDC от Apple

Жду интеграцию ИИ всюду. По слухам, за это будет отвечать как и своя моделька, on-device, так и облачная, от OpenAI.

Я, конечно же, расскажу об интересных анонсах с презентации, а пока можно посмотреть стрим.

@ai_newz

YouTube

WWDC 2024 — June 10 | Apple

Watch the WWDC24 keynote introducing Apple Intelligence, personal intelligence designed to be helpful and relevant to you. Other exciting updates are coming with iOS 18, iPadOS 18, macOS Sequoia, watchOS 11, and visionOS 2.

To watch the event interpreted…

16.5K viewsedited 16:44

эйай ньюз

Image Playground - новый генератор изображений от Apple, работает локально

@ai_newz

15.7K views18:32

эйай ньюз

🍏 AI это теперь Apple Intelligence

Ну что Тим Кук и его команда провели свой wwdc. Новостей много – интересно пощупать на деле. Очень надеюсь, что Siri наконец перестанет быть бесполезной звонилкой, которой народ обычно пользуется за рулём.

Выбрал для вас самое интересное:

Выкатили так называемую систему личного интеллекта Apple Intelligence (AI), которая будет глубоко интегрирована в iOS 18, iPadOS 18 и macOS Sequoia. Да, название звонкое придумали.

Новые чипы Apple Silicon A17 Pro и M-серии будут оптимизированы для работы с языковыми моделями и моделями генерации изображений. Вот что они смогут делать ЛОКАЛЬНО:

➖ Ассистент для письма, работающий по всей ОС

➖ Появятся новые AI-функции в приложениях Mail, Notes, Safari, Photos и других, включая генерацию текста и изображений:

* Самари и разметку приоритетов уведомлений

* Генерировать эмодзи и картинки

* Поправлять скетчи внутри заметок и генерить картинки по ним

* Поиск текстом по видео в вашей галлерее! И можно попросить слепить из них ролик по промпту.

➖ Новая Siri - основана на LLM, понимает контекст, с ней можно чатиться текстом. Вот здесь писал про слухи об этом.

* Siri может пользоваться приложениями

* У неё теперь есть доступ к эмейлам и другим приватным данным, которые обрабатываются локально

* На случай если локальной LLM не хватает есть Private Cloud Compute - возможность запускать облачную LLM на серваках Apple работающих на собственных чипах, обещают что данные нигде не сохраняются

* Теперь у Siri будет интеграция с ChatGPT, обещают другие модели позже

➖ Для разработчиков будут доступны API для интеграции AI-функций в их приложения без дополнительных усилий

Кроме этого, добавили всякую модную кастомизацию и так по мелочи. Вроде бы все неплохо, есть интересные моменты, но акции чет просели, видимо инвесторы ожидали большего 🤷‍♀

Ждем дальше когда Siri станет полноценным агентом.

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

41.0K viewsedited 19:24

эйай ньюз

Рыночек ожидал явно большего от эпл эйай. Хотя неплохо вроде бы выступили. Купертиновский оверхайп?

По сути технологических инноваций особенно не было - но новыми интеграциями с iOS упростился порог входа для использования AI-инструментов для многих миллионов обычных пользователей, что тоже круто!

@ai_newz

18.8K views19:40

эйай ньюз

Маск сгорел с анонсированного доступа Сири к личным данным и собирается запретить девайсы эппл в своих компаниях.

Да-да, даже макбуки

@ai_newz

22.6K viewsedited 21:11

эйай ньюз

Пока я был неделю в отпуске в Морокко, NVIDIA перевалила за ТРИ триллиона $$$ и стала дороже чем Apple – несмотря на их вчерашние релизы – и дороже чем все немецкие компании, торгующиеся на бирже, вместе взятые!

Поздравляю всех, кто имел прозорливость проинвестировать в NVIDIA несколько лет назад.

@ai_newz

19.0K viewsedited 12:55

эйай ньюз

Video

😜У моего друга китайца появился доступ к Kling! Сейчас будем вместе с ним тестировать.

Покидайте интересные промпты в комменты (лучше на английском). Потом выложу генерации в канал.

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

17.2K viewsedited 11:45

эйай ньюз

🔥

Веса SD-3 Medium уже доступны!

Как и обещали, Stability релизнули Stable Diffusion 3 Medium с двумя миллиардами параметров. Она бесплатна для некоммерческого пользования. За коммерческое использование придётся платить: $20 в месяц для индивидуальных пользователей и небольших бизнесов, для бизнесов побольше - энтерпрайз лицензия.

Поддержка модели уже есть в ComfyUI, для автоматика придётся подождать.

Судя по публичным заявлениям сотрудников Stability, 8B модель ещё тренируется (что-то очень долго они ее уже тренируют). Но непонятно почему не релизнули 800m "Small" версии.

* В комментах пишут, что модель влазит в 6GB видео памяти.

* Скорость генерации: 12 sec/img на RTX 4070

Блогпост
Веса

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

26.4K viewsedited 13:11

эйай ньюз

YaFSDP - опенсорс либа от Яндекса для ускорения тренировки больших моделей

Современные LLM тренируются на огромных кластерах доходящих до десятков тысяч GPU. А так как один в поле не воин - им нужно постоянно общаться между собой, при этом когда в одну видеокарту веса моделей не влезают, их нужно шардить - распределять между многими видеокартами.

Основной метод шардинга сейчас - FSDP, он встроен в PyTorch и им пользуются абсолютно все. Но и он не идеален - имеет свойство выделять больше памяти, чем нужно, и простаивать на бэквард пассе.

Ребята из Яндекса решили эти проблемы и у них вышел YaFSDP - оптимизированная имплементация FSDP, лучшая из открыто доступных - на тренировке LLaMa 3 70B ускорение достигает 26%, при этом потребление памяти - меньше! А в Яндексе полная интеграция YaFSDP вообще позволила ускорить тренировку на 45%. Это напрямую транслируется в удешевление претрейна больших моделей.

Как такое возможно?

* Стратегические преалокации памяти позволяют сильно сбавить оверхед и использовать именно столько памяти, сколько нужно.

* Упорядочивание использования ресурсов так, чтобы на них не было сразу нескольких претендентов уменьшает простой видеокарты - не нужно ждать пока ресурсы освободятся.

* Оптимизированная нормализация уменьшает количество копирований на бэквард пассе.

Библиотека уже доступна на Github, с лицензией Apache 2.0 - то есть может пользоваться кто угодно, как угодно и абсолютно бесплатно.

@ai_newz

GitHub

GitHub - yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel

YaFSDP: Yet another Fully Sharded Data Parallel. Contribute to yandex/YaFSDP development by creating an account on GitHub.

16.5K views18:16

эйай ньюз