D. Lab
1.12K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🫡 Runway открыла доступ к новой версии своего генератора видео

💰 С анонса прошла всего пара недель. Месячная подписка стоит минимум $15, по этому тарифу доступно 62 секунды видео от Gen-3 Alpha. Модель позволяет сгенерировать ролики длиной не больше 10 секунд

⚔️ Тестерам доступ дали на сутки раньше, поэтому они уже успели поэкспериментировать. Один из них даже сравнил результаты работы Gen-3 с Sora от OpenA на одинаковых промптах. Выбрать однозначного победителя не получилось: где-то лучше справилась модель от Runway, где-то преимущество осталось за Sora. Например, на одном из видео у Gen-3 пыль опережает проезжающий джип
В целом, генерации у OpenAI получались как будто более реалистичными. Зато Gen-3 лучше изображала людей

🙁 Уже после официального релиза Gen-3 Alpha многие пользователи написали, что генератор еще сырой. Да, ролики на сайте выглядели очень прилично. Но, как это часто бывает, в паблике показали только лучшие результаты. На деле нейросеть плохо справляется со сложными промптами, игнорирует части слов и выдает одно нормальное видео на 4 генерации

Зато, как справедливо отвечают пользователи, Gen-3 хотя бы можно попробовать. Доступ к той же Sora с февраля так и не открыли. Гипотезы две: что в OpenAI боятся дипфейков перед надвигающимися выборами, и что модель еще не доработана и съедает слишком много ресурсов
🔥3👍1
🦖🦤🦣 Meta* представила очень быструю ИИ-систему для генерации 3D-активов

Meta 3D Gen создает 3D-модели из текстовых описаний меньше чем за минуту. В компании говорят, что это в 3-10 раз быстрее, чем позволяют другие решения на рынке. При этом Meta обещает высокое качество даже для сложных промптов.

🌐 ИИ-система объединяет два главных компонента:
- Meta 3D AssetGen (text-to-3D) для генерации 3D-сеток, они же меши. Это набор из вершин, ребер и граней, которые составляют один 3D-объект;
- Meta 3D TextureGen (text-to-texture) для генерации текстур.

📝 Схема работы такая: сначала пользователь за 30 секунд создает первую версию 3D-модели с помощью 3D AssetGen. Потом можно либо доработать существующую текстуру модели, либо вообще заменить ее на новую. В обоих случаях это делается с помощью текстовых промптов (здесь как раз вступает в игру Meta 3D TextureGen). Это займет еще примерно 20 секунд.

💡 Одна из главных фич 3D Gen — поддержка PBR (Physically based rendering, или физически корректный рендеринг). Этот метод позволяет более достоверно отображать объекты, моделируя поток света в реальном мире. Сгенерированные другими инструментами модели часто выглядят неестественно, потому что нейросети не могут правдоподобно отразить свойства материалов и то, как они меняются при разном освещении. Meta 3D Gen может это исправить.

🎮 Система пока находится на стадии разработки, потестировать ее нельзя. Но она может пригодиться для гейминга, кино, архитектуры и любых других сфер, где нужна трехмерная графика.

*организация признана экстремистской и запрещена в России
👍2🤔1
🔮 Билл Гейтс считает, что сверхчеловеческий ИИ ближе, чем мы думаем (и он сильно изменит мир)

Основатель Microsoft стал гостем подкаста The Next Big Idea, где обсуждали ИИ и его влияние на общество. Несколько важных тезисов из интервью:

🤖 Скоро каждого человека будет сопровождать персональный ИИ-ассистент. Он сможет отслеживать и анализировать всю нужную информацию и понимать контекст задач. Раньше люди не могли доверить компьютеру даже организовать свою почту, потому что устройства не способны были понять намерения пользователя. Благодаря ИИ всё изменилось.

У людей также появятся ИИ-друзья, ИИ-психотерапевты и, возможно, даже виртуальные романтические партнеры. Они будут работать в разных режимах в зависимости от того, какая информация им доступна. Но именно персональный ассистент будет знать о нас практически все.

💭 ИИ дойдет до стадии метапознания через две итерации (связанные с апгрейдами в сфере видеоданных и синтетических данных). Нейросети смогут самостоятельно планировать свои действия, расставлять приоритеты, выбирать инструменты и методы для достижения целей и даже проверять результаты. По сути, Билл Гейтс говорит, что у ИИ появится критическое мышление.

👩‍💼 ИИ сильно изменит рынок труда. С учетом предыдущего пункта становится понятно, что нейросети смогут выполнять многие задачи лучше людей. Из этого следует две идеи:
▪️ Государственным организацием и частным компаниям нужно уже сейчас учить работников тем навыкам, которые будут актуальны для новой ИИ-экономики. В первую очередь это касается «белых воротничков» (хотя до «синих» дело тоже дойдет). При этом как раз «белым воротничкам», которые занимаются интеллектуальной деятельностью, перестроиться будет проще;
▪️ В целом, людям придется искать новые цели в жизни. Погоня за достатком и безостановочная работа уйдут в прошлое. Люди смогут сфокусироваться на более креативных задачах и важных социальных проблемах. Каких именно — тоже может подсказать ИИ с учетом склонностей каждого человека.

💉ИИ повлияет на здравоохранение и образование. Гейтс говорит, что за последние 20 лет общество смогло сократить детскую смертность вдвое за счет распространения и удешевления вакций. Но с ИИ можно пойти дальше и решать проблемы на начальном этапе. Он поможет понять, почему дети недоедают, или почему так трудно создать вакцину от ВИЧ.

Нейросети помогут совершать научные открытия (и создавать новые лекарства как следствие) и проводить диагностику пациентов. Плюс, с их помощью можно будет проводить персональные медицинские консультации на разных языках.

По аналогии люди из менее обеспеченных регионов смогут получить доступ к персональным тьюторам прямо в мобильных телефонах. Это особенно актуально с учетом огромной нехватки специалистов и ресурсов в развивающихся странах
🔥3🤔2
🛤 GPT-5 сделает рывок вперед по сравнению с GPT-4 — но это все еще малая часть ИИ-потенциала, считает Сэм Альтман

В интервью на Фестивале идей в Аспене CEO OpenAI дал несколько спойлеров про GPT-5. Он сказал, что GPT-4 толком не может рассуждать, иногда просто «сходит с рельсов» и совершает глупые ошибки, которые не сделал бы и 6-летний ребенок. А вот GPT-5 должна это исправить: она будет лучше справляться с рассуждениями и меньше ошибаться.

⚙️ Правда, долгожданная модель пока находится на ранней стадии разработки. Скорее всего, это связано со сложностью алгоритмов и потребностью в огромных объемах данных. Ближайшие месяцы определят, получится ли у GPT-5 превзойти ожидания пользователей и самого Альтмана.

📱 Сэм Альтман сравнил нынешнее состояние ИИ-рынка с ранними днями iPhone. Первые айфоны были полезны для людей, несмотря на кучу багов. Такая же история и с LLM: они многое умеют, но все еще находятся на начальной стадии и демонстрируют малую часть своего потенциала.

🔍 Еще Альтман считает: сегодняшние модели ИИ относительно маленькие по сравнению с тем, какими они могут стать в будущем. В прошлом году он предположил, что эра гигантских языковых моделей близится к концу. Но мнение Альтмана успело поменяться. Теперь он считает, что модели будут расти благодаря инвестициям в вычислительную мощность и энергию.

📝 На мероприятии Альтман не упустил возможности похвастаться этичным подходом OpenAI, который предполагает лицензирование контента от СМИ (в январе компания предложила до $5 млн в год за лицензии от CNN, Time и Fox на использование их материалов для обучения ChatGPT). Сэм противопоставил OpenAI Google, где говорят, что ИИ-трафик и так приносит пользу издателям — это сомнительное утверждение доверия у рынка не вызывает.

🛍 CEO OpenAI говорит, что ИИ «не суперсильно, но в значительной степени» изменит то, как люди используют интернет. На этом фоне будут появляться новые бизнес-модели, в том числе в сфере коммерции.
🔥3🤔3
👸 «Королева интернета»‎ выпустила первый отчет за четыре года, и он про ИИ

Мэри Микер — американский венчурный инвестор и одна из самых влиятельных аналитиков в мире. Она работала в Morgan Stanley и Kleiner Perkins, и в свое время первой предсказала бум доткомов. А еще она известна обзорами интернет-трендов, которые пользовались большой популярностью и расходились на цитаты в Кремниевой долине — за что Микер и зовут «королевой интернета». Только последний такой отчет был в 2019 году, плюс еще один в 2020-м.

📚 В этот раз Микер выпустила довольно скромный по объемам отчет (всего 16 страниц — в 2019 году он занимал больше 300!) про ИИ с фокусом на образование в США. Такой интерес к теме связан, видимо, с тем, что именно «американские высшие учебные заведения раньше были бастионами технологического прогресса».

🤖 Микер пишет, что на фоне ИИ-бума мы дошли до стадии, когда сферу образования ждут «быстрые и яростные изменения». ИИ может стать универсальным инструментом в индустрии.

🎓 Интернет и так сильно изменил процесс обучения — благодаря поисковикам, соцсетям, онлайн-курсам, YouTube и другим платформам знания стали доступны как никогда. Но ИИ поменяет образование в больших масштабах. Несколько примеров:
▪️ Повсеместное распространение приложений для учебы и ИИ открывает студентам доступ к профессиональным знаниям в области юриспруденции, программирования и многих других сфер;
▪️ ИИ-репетиторы теперь доступны 24/7 всем, у кого есть доступ в интернет. Они могут в реальном времени давать студентам персонализированный фидбек;
▪️ Нейросети могут адаптировать подходы к обучению с учетом особенностей каждого человека. Например, для людей с дислексией ИИ может автоматически переводить текст в речь;
▪️ Информация теперь все время под рукой. Можно не запоминать ее, а сразу пытаться применить знания на практике;
▪️ В новой парадигме преуспеют самые мотивированные студенты, которые могут учиться самостоятельно;
▪️ ИИ-модели могут давать как верные ответы, так и совсем неправильные. Учителям нужно будет оптимизировать процесс обучения с учетом этого факта;
▪️ ИИ поможет преподавателям готовить персонализированные учебные планы и материалы, проверять домашние задания, отслеживать посещаемость;
▪️ Учителя станут коучами, тьюторами и наставниками, которые не просто доносят информацию, а создают более располагающую атмосферу в классе, в том числе виртуальном.

💸 Молодые люди уже начинают задумываться, а стоит ли высшее образование их вложений (не только денег, но и времени). Поэтому университеты будущего должны будут воспринимать обучение как сервис, а студентов — как своих клиентов. Самым важным для них будет найти дифференциаторы (ключевые отличия от конкурентов), чтобы гарантировать учащимся максимальный возврат инвестиций.

🤝 Образовательным учреждениям сегодня нужно сотрудничать с лидерами в области технологий, а не сталкиваться с ними лбами. ИИ может стать для вузов или попутным ветром, или встречным. Наличие технических ресурсов, таких как доступ к GPU, вероятно, станет ключом к лидерству.

🖌 ИИ будет топливом для студенческого творчества и инноваций. Он может сократить непосредственное участие человека в некоторых дисциплинах и при этом освободить его интеллект и изобретательность — а это основная сила, которая стоит за появлением новых идей.
🔥5🤔3
Apple хочет внедрить ИИ в Vision Pro, в ElevenLabs «воскрешают» знаменитых актеров, удалять AI-контент с YouTube будет проще — и другие важные новости за неделю

Яндекс начал маркировать рекламу, созданную генеративным ИИ. В 2023 году предприниматели получили возможность бесплатно добавлять в свои рекламные объявления креативы от нейросети YandexART. К июню этого года опцией воспользовались больше 11% активных рекламодателей в Директе. Теперь на такой интернет-рекламе можно будет увидеть пометку, нажав на три точки в верхнем правом углу объявления;

Apple планирует внедрить свою ИИ-систему Apple Intelligence в Vision Pro, пишет Bloomberg. На недавней конференции WWDC компания рассказала, что ИИ появится в iPhone, iPad и Mac, а про гарнитуру речи не было — это приятный сюрприз для пользователей. Но рассчитывать на обновление в этом году не стоит. Компании еще предстоит понять, как новые фичи могут выглядеть в виртуальной реальности;

YouTube теперь позволяет запрашивать удаление AI-контента, который копирует ваши лица и голоса. Раньше можно было только требовать удалить дипфейки, если они «вводят в заблуждение». Теперь можно сослаться на нарушение конфиденциальности. Но сам запрос не означает, что контент точно уберут. YouTube будет изучать такие ролики и учитывать их ценность, кого именно они изображают, в каком виде и так далее;

Figma временно отключает ИИ-функцию, которая копирует дизайны Apple. Make Design позволяла генерировать макеты и UI-компоненты на основе текстовых промптов. Вот только основатель NotBoring Software в процессе тестирования обнаружил, что функция неоднократно воспроизводила приложение Weather от Apple. Make Designs вроде как использует GPT-4o от OpenAI и Titan Image Generator G1 от Amazon. Если это правда, возникает вопрос, не учились ли они на разработках Apple;

В ElevenLabs «воскресили» умерших голливудских звезд для чтения текстов. Речь идет об обновлении для недавно выпущенного приложения Reader App. Теперь ИИ компании сможет зачитывать файлы пользователей голосами четырех голливудских звезд: Берта Рейнольдса, Джуди Гарланд, Джеймса Дина и сэра Лоуренса Оливье. ElevenLabs тесно сотрудничала с наследниками покойных знаменитостей, чтобы их цифровые аватары звучали так же, как когда-то они сами;

WhatsApp* разрабатывает генератор персонализированных аватаров. Новую функцию заметили в бета-версии WhatsApp для Android 2.24.14.7. Пользователям нужно будет загружать изображения и писать текстовые промпты, а Meta** Llama выдаст готовые аватары. Так можно будет представить себя в любой локации, от леса до космоса. В общем, новая опция напоминает нашумевшее приложение Lensa AI. Правда, пока непонятно, когда она выйдет в паблик.

*WhatsApp входит в Meta — организацию, запрещенную на территории РФ
**Организация, запрещенная на территории РФ
👍3
⚠️ Microsoft, Meta*, Nvidia предупредили инвесторов о рисках ИИ

Не менее десятка крупных техкомпаний добавили в последние финансовые отчеты предупреждения, связанные с ИИ.

✍️Предупреждения публикуются в разделе «Факторы риска». В нем компании описывают, что может пойти не так, пытаясь предотвратить судебные иски акционеров.

🔸Alphabet заявила, что использование ее ИИ-сервисов «может негативно повлиять на права человека, конфиденциальность, рынок труда или другие социальные проблемы», что приведет к судебным искам или финансовому ущербу
🔸Meta* предупредила, что некоторые люди могут использовать ИИ компании для распространения дезинформации во время выборов, что повредит имиджу бренда
🔸Microsoft заявила, что может столкнуться с исками художников, музыкантов и писателей о нарушении авторских прав со стороны ИИ.

✂️Иногда предупреждения компаний идут вразрез с их официальной линией. Adobe давно говорит о том, что Photoshop и подобные программы останутся ключевыми для творческих профессионалов. Но уже в этом году компания предупредила, что распространение ИИ может повредить рынку труда и нарушить спрос на существующее ПО.

🔮Некоторые риски, о которых говорят компании, сбываются. Nvidia с начала 2023 года предупреждала, что опасения по поводу ИИ могут привести к ограничениям на ее продукты. После этого правительство США ограничило экспорт передовых компьютерных чипов в Китай, включая чипы Nvidia.

*Организация, запрещенная на территории РФ
🔥2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
👗Bershka предложили составлять и носить виртуальный гардероб

Бренд интегрировал 25 AR-фильтров на базе Snap в свое приложение. Пользователи могут собрать и виртуально примерить весь аутфит целиком, а не отдельную вещь. Также можно включить фильтры во время видеосъемки, чтобы лучше оценить, как одежда смотрится в реальной жизни.
👍3🤔2🔥1
🎈 Sequoia Capital: ИИ — финансовый пузырь, и он рискует лопнуть

Огромные инвестиции техгигантов в инфраструктуру ИИ пока не привели к росту доходов от этого бизнеса, считает Дэвид Кан, аналитик Sequoia Capital (венчурный фонд, инвестировавший в Apple, Google, PayPal, YouTube до того, как это стало мейнстримом). Эксперт уверен, что профильным компаниям нужно зарабатывать гораздо больше, чтобы окупить вложения.

💎Производитель Nvidia заработал в 2023 году $47,5 млрд на продажах оборудования для ЦОД (в основном, ИИ-ускорителей). При этом доходы от ИИ у основных клиентов компании гораздо скромнее. Сюда входят AWS, Google, Meta*, Microsoft и многие другие. Лишь OpenAI, пользующаяся инфраструктурой Microsoft Azure, смогла значительно увеличить доходы с $1,6 млрд в 2023 году до $3,4 млрд в 2024 году.

💰 Кан считает, что ИИ-компаниям нужно зарабатывать около $600 млрд в год, чтобы компенсировать расходы на инфраструктуру. Чтобы рассчитать сумму покрытия общих затрат на ЦОД, аналитик увеличил вдвое прогноз текущих доходов NVIDIA. Результат он вновь удвоил — полученная сумма должна обеспечить половину валовой прибыли конечных потребителей ИИ-сервисов от AWS или Microsoft Azure.

🤑 Даже если Google, Microsoft, Apple и Meta* будут ежегодно зарабатывать по $10 млрд на ИИ-сервисах, а такие компании, как Oracle, ByteDance, Alibaba, Tencent, X и Tesla — по $5 млрд, останется еще $500 млрд затрат, которые нужно окупить. Дэвид Кан считает, что это говорит о росте финансового пузыря.

♻️ Чтобы избежать катастрофы на рынке, Кан предложил снизить ожидания быстрой прибыли от ИИ и сфокусироваться на устойчивых инновациях и создании действительно ценного продукта для конечных пользователей.

*Организация, запрещенная на территории РФ
🤔3
Верхний ряд: оригинальные изображения. Нижний ряд: изображения, реконструированные ИИ на основе записей мозга макаки.

🧠 ИИ научился читать мысли с фотографической точностью

👁 Нидерландские ученые разработали систему, которая по данным активности мозга может сказать (и показать), что человек увидел за день. Для этого использовали функциональные МРТ-сканеры (фМРТ) и имплантированные электроды, которые фиксировали активность мозга и переводили ее в изображения.

🏞В одном эксперименте участвовали три человека, которые просматривали серию фотографий. Технология проанализировала данные об активности их мозга и превратила сигналы в реалистичные картинки. Аналогичный эксперимент провели с обезьяной, ​​только она смотрела на изображения, созданные ИИ.

🤖Результаты также показали, что ИИ гораздо легче воссоздать изображения, сгенерированные нейросетью, чем изображения, полученные без помощи технологий. Систему обучили фокусироваться на определенных частях мозга, что значительно повысило точность воссозданных изображений.

🗣 Ранее японские ученые с помощью фМРТ уже проводили подобные эксперименты, но тогда результаты были скромнее.
3
This media is not supported in your browser
VIEW IN TELEGRAM
🚘 Пользователь Reddit в одиночку сделал видеорекламу Volvo с помощью нейросети

Автор показал коммерческий потенциал модели RunwayML Gen-3 Alpha, создав с помощью нее целый рекламный ролик. По его словам, проект занял 24 часа, включая создание, редактирование, ретушь и звуковой дизайн клипа. Небольшие изменения автор внес в Adobe After Effects: логотип, номера машины и др.

😎 Автор называет версию Gen-3 большим шагом вперед по сравнению с Gen-2. Он также уверен, что Gen-3 изменит индустрию видеопродакшена.

🧸 Ранее крупнейший в США ритейлер в сфере игрушек Toys R Us представил рекламный ролик, почти полностью сгенерированный нейросетью Sora.
🔥71🤔1
📈 OpenAI оценил свои технологии на 2 из 5

Компания создала внутреннюю шкалу для отслеживания развития ИИ-разработок. Существующие чат-боты, такие как ChatGPT, находятся на 1 уровне. OpenAI считает, что ее технологии уже приближаются к уровню 2, когда система может решать базовые задачи на уровне человека с докторской степенью.

На уровне 3 ИИ может выполнять действия от имени пользователя, на уровне 4 — создавать инновации. Уровень 5 — система, которая может выполнять работу вместо целых организаций. ИИ 5 уровня — последний шаг к достижению пресловутого AGI. Компания не раскрыла подробностей того, как ее разработкам будет присуждаться тот или иной уровень прогресса.

🤓 По данным Bloomberg, руководство компании в ходе собрания представило итоги проекта, где GPT-4 демонстрирует новые навыки «человеческого мышления».

🌟 Достичь AGI — одна из ключевых миссий OpenAI. При этом компания учитывает, что есть и другие ИИ-проекты, которые стремятся к той же цели. В уставе OpenAI сказано, что если другой проект, «ориентированный на ценность и безопасность, приближается к созданию AGI» раньше, чем это сделает OpenAI, компания прекратит конкурировать и поспособствует развитию проекта.

🧠 Для AGI потребуются миллиарды долларов на вычислительные мощности. И хотя идея суперинтеллекта звучит невероятно, главы техкомпаний предсказывают его наступление уже в ближайшие годы. В 2023 году Сэм Альтман заявил, что осталось «плюс-минус пять лет», прежде чем мы достигнем AGI. Основатель SingularityNET Бен Гертцел допускает, что AGI может появиться в 2027 году. А экс-инженер Google Джеффри Хинтон считает, что до появления AGI осталось 5-20 лет.
2🤔1
В Photoshop и WhatsApp теперь можно редактировать фото по промптам, Xiaomi запустил круглосуточную ИИ-фабрику без людей — и другие важные новости за неделю

Photoshop добавил ИИ-плагин Magniific. С его помощью можно повысить разрешение любой картинки в 16 раз до 4К. Скоро добавят режимы Style Transfer и Relight, чтобы менять фильтры, стили, погоду, время суток и освещение по текстовым промптам;

WhatsApp* также тестирует функцию редактирования фото с помощью текстовых команд. Пользователям нужно загрузить фото в чат с Meta** AI. Нейросеть может определить объекты на фото, объяснить смысл изображения или быстро отредактировать фото;

Китай занял первое место по внедрению генеративного ИИ, по данным аналитиков SAS и Coleman Parkes. Технологию используют 83% опрошенных китайских компаний — это больше, чем в 16 других странах и регионах. Для сравнения, в США нейросети используют 65% компаний, а средний показатель по миру составил 54%;

Xiaomi показал полностью роботизированную фабрику по сборке смартфонов. Она будет работать круглосуточно без людей и собирать по одному смартфону в секунду. Площадь фабрики — 80 тыс. кв метров, ожидаемая производительность — более 10 млн аппаратов в год;

Американский производитель микросхем AMD покупает финский стартап Silo AI за $665 млн. Silo AI — крупнейший ИИ-стартап в Европе, среди его клиентов — Philips, Rolls-Royce и Unilever. Таким образом AMD хочет усилить свои позиции на рынке и обойти главного конкурента — Nvidia;

Ipsos изучил отношение потребителей во всем мире к ИИ. 53% опрошенных говорят, что им нравятся ИИ-продукты и услуги, при этом у 50% респондентов нейросети вызывают опасения. В Азии интерес к ИИ выше, в то время как англоговорящие страны и Европа настроены более скептически;

Гонконг хочет изменить закон об авторском праве для развития ИИ. Власти могут разрешить ИИ использование онлайн-контента, защищенного авторским правом, для машинной обработки. Город стремится стать региональным центром торговли интеллектуальной собственностью;

OpenAI закрывает доступ к API в Китае и некоторых других странах. Блокировка приведет к переходу китайских разработчиков на локальные альтернативы. Так, компания Baidu планирует запустить бесплатный доступ к нейросети Ernie, а компания Zhipu AI запустит «специальную программу миграции» для пользователей OpenAI.

*WhatsApp входит в Meta — организацию, запрещенную на территории РФ
**Организация, запрещенная на территории РФ
1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Японец показал чудеса владения нейросетями

Арата Фукое любит экспериментировать с видео (и даже был одним из амбассадоров камер GoPro в стране), а в последнее время заинтересовался генеративным ИИ.

🫡 У себя в соцсетях он выложил видео, почти полностью созданное нейросетями (почти, потому что не обошлось без фотошопа и After Effects).

📹 За видеоряд отвечали: Kling, Gen-3 и DreamMachine. Они анимировали изображения, сгенерированные Stable Diffusion и Midjourney.

🎧 ChatGPT и Suno обеспечили саундтрек.

🙏 Фукое клянется, что при создании ролика ни одного «живого» кадра не использовал.

🖱 На сайте автора можно также посмотреть его эксперименты с нерфами (один из них создан при помощи трех десятков GoPro).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
💪 Самый наглядный пример того, как генеративный ИИ прокачался за год

Помните нейрорекламу несуществующей пиццерии Pepperoni Hug Spot, выполненную в лучших традициях роликов с Уиллом Смитом, поедающим макароны?

🔩 Ее автор выпустил римейк, использовав вместо нейросети Gen-2, только что вышедшую Gen-3.

🔮 Страшно представить, каким будет ролик в 2025 году.
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔈 Heygen научился оживлять аватары по аудио

Стартап запустил бета-тест новой функции Expressive Photo Avatars.

1️⃣ Выбираете изображение с аватаром.

2️⃣ Добавляете аудио с речью продолжительностью от 3 до 30 секунд (можно загружать и музыку).

3️⃣ На выходе получаете анимацию, сгенерированную с учетом «эмоционального настроя» аудио.

🫡 Попробовать можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 Стилизация видео нейросетями в прямом эфире

Live2Diff позволяет редактировать видео прямо во время лайв-стрима, используя диффузионную нейросеть.

😱 Авторы считают свою технологию прорывной. Они объясняют, что обычные нейросети не могут корректно работать с живым видео, так как им нужно четко представлять, что будет происходить в видео дальше.

🤯 Live2Diff достаточно несколько кадров, чтобы на их основе дальше выдавать консистентную и плавную картинку.

🤟 Чудес от работы модель ждать пока не стоит. Разработчики уточняют, что это их первая попытка, которая в большей степени должна показать, что метод работает.

🔩 Сейчас Live2Diff на топовом GPU RTX 4090 выдает 16 кадров.

🗓 В ближайшие дни обещают выложить код на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21😱1
🎧 Яндекс Музыка научилась распознавать редкие жанры музыки с помощью ИИ

Стриминг-сервис с помощью нейросетей и музыкальных экспертов научился советовать пользователю исполнителей малоизвестных жанров: мумбатон, детройтское техно, ню-джаз и т.д.

🔩 Сначала редакторы сервиса определили редкие музыкальные жанры, затем музыкальные эксперты подобрали под них треки.

На основе выбора экспертов для каждого жанра создали ML-разметку (грубо говоря, датасет, где каждый трек помечен соответствующим ему жанром), по которой техническая команда стриминг-сервиса обучала нейросеть.

🔎 Яндекс обещает, что система рекомендаций и для малоизвестной музыки останется персонализированной — то есть даже в самых нишевых жанрах система должна найти треки, которые вероятнее всего понравятся слушателю.

🗺 Посмотреть, какие жанры теперь знает Яндекс Музыка, можно в разделе Тренды стриминг-сервиса или на интерактивной карте.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Люди очеловечивают чат-ботов, Европейцы не получат доступ к новым ИИ-моделям Meta*, названа дата выхода самой мощной версии Llama 3 — и другие важные новости за неделю

OpenAI запрещал сотрудникам публично говорить о потенциальной опасности, которую разработки стартапа могут нести для человечества. Запрет был не словесным — работники подписывали документ о неразглашении. Сотрудники также были обязаны предварительно уведомить OpenAI, если им вдруг придет в голову пойти в госорганы, чтобы предупредить об опасных (по мнению сотрудников) разработках;

Британские исследователи на основе опроса 300 респондентов сделали вывод, что большинство пользователей склонны очеловечивать чат-ботов — наделять их памятью и чувствами. Авторы исследования считают, что это может привести к негативным последствиям — эмоциональной привязанности и чрезмерной зависимости от ИИ при принятии важных решений;

Самая мощная версия опенсорсной языковой модели Llama 3 выйдет уже 23 июля. У мультимодальной LLM будет 405 млрд параметров. Предрелизная версия показала себя чуть хуже топовых LLM от Google, OpenAI и Anthropic. Весной Meta выпустила версии Llama 3 с 8 млрд и 70 млрд параметров;

На этой неделе также стало известно, что Meta не будет давать доступ к своим мультимодальным моделям с открытым кодом на территории ЕС. В компании объяснили это слишком запутанной регуляторной политикой на территории Евросоюза в отношении ИИ. За несколько недель до этого Apple объявил, что тоже пока не собирается запускать ИИ-функции (Apple Intelligence) новой версии iOS на территории ЕС — по той же причине;

Журналисты выяснили, что бигтехи без спроса тренируют ИИ-модели на расшифровках видео с YouTube. Издание Wired обнаружило целый датасет с текстовыми версиями видео с популярных каналов. На его использовании попались Apple, Nvidia, Anthropic и другие. Такое использование ютубовского контента прямо нарушает правила платформы. В Apple уже заявили, что ничем таким не занимаются;

Рыночная капитализация Nvidia может достигнуть $50 трлн, считает инвестор Бейли Гиффорд. Звучит безумно, учитывая, что компания только-только преодолела отметку в $3 трлн. Но если кому и делать такие заявления, так это Гиффорду. Он был одним из первых инвесторов Tesla и Amazon, а активы под его управлением принесли инвесторам больше 2000% прибыли. Инвестор уточняет — такой стоимости компания может достичь, если ИИ станет по-настоящему полезным для обычных пользователей, а Nvidia к тому моменту все еще будет в лидерах.

*Организация, запрещенная на территории РФ
👍1