D. Lab
1.12K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🛤 GPT-5 сделает рывок вперед по сравнению с GPT-4 — но это все еще малая часть ИИ-потенциала, считает Сэм Альтман

В интервью на Фестивале идей в Аспене CEO OpenAI дал несколько спойлеров про GPT-5. Он сказал, что GPT-4 толком не может рассуждать, иногда просто «сходит с рельсов» и совершает глупые ошибки, которые не сделал бы и 6-летний ребенок. А вот GPT-5 должна это исправить: она будет лучше справляться с рассуждениями и меньше ошибаться.

⚙️ Правда, долгожданная модель пока находится на ранней стадии разработки. Скорее всего, это связано со сложностью алгоритмов и потребностью в огромных объемах данных. Ближайшие месяцы определят, получится ли у GPT-5 превзойти ожидания пользователей и самого Альтмана.

📱 Сэм Альтман сравнил нынешнее состояние ИИ-рынка с ранними днями iPhone. Первые айфоны были полезны для людей, несмотря на кучу багов. Такая же история и с LLM: они многое умеют, но все еще находятся на начальной стадии и демонстрируют малую часть своего потенциала.

🔍 Еще Альтман считает: сегодняшние модели ИИ относительно маленькие по сравнению с тем, какими они могут стать в будущем. В прошлом году он предположил, что эра гигантских языковых моделей близится к концу. Но мнение Альтмана успело поменяться. Теперь он считает, что модели будут расти благодаря инвестициям в вычислительную мощность и энергию.

📝 На мероприятии Альтман не упустил возможности похвастаться этичным подходом OpenAI, который предполагает лицензирование контента от СМИ (в январе компания предложила до $5 млн в год за лицензии от CNN, Time и Fox на использование их материалов для обучения ChatGPT). Сэм противопоставил OpenAI Google, где говорят, что ИИ-трафик и так приносит пользу издателям — это сомнительное утверждение доверия у рынка не вызывает.

🛍 CEO OpenAI говорит, что ИИ «не суперсильно, но в значительной степени» изменит то, как люди используют интернет. На этом фоне будут появляться новые бизнес-модели, в том числе в сфере коммерции.
🔥3🤔3
👸 «Королева интернета»‎ выпустила первый отчет за четыре года, и он про ИИ

Мэри Микер — американский венчурный инвестор и одна из самых влиятельных аналитиков в мире. Она работала в Morgan Stanley и Kleiner Perkins, и в свое время первой предсказала бум доткомов. А еще она известна обзорами интернет-трендов, которые пользовались большой популярностью и расходились на цитаты в Кремниевой долине — за что Микер и зовут «королевой интернета». Только последний такой отчет был в 2019 году, плюс еще один в 2020-м.

📚 В этот раз Микер выпустила довольно скромный по объемам отчет (всего 16 страниц — в 2019 году он занимал больше 300!) про ИИ с фокусом на образование в США. Такой интерес к теме связан, видимо, с тем, что именно «американские высшие учебные заведения раньше были бастионами технологического прогресса».

🤖 Микер пишет, что на фоне ИИ-бума мы дошли до стадии, когда сферу образования ждут «быстрые и яростные изменения». ИИ может стать универсальным инструментом в индустрии.

🎓 Интернет и так сильно изменил процесс обучения — благодаря поисковикам, соцсетям, онлайн-курсам, YouTube и другим платформам знания стали доступны как никогда. Но ИИ поменяет образование в больших масштабах. Несколько примеров:
▪️ Повсеместное распространение приложений для учебы и ИИ открывает студентам доступ к профессиональным знаниям в области юриспруденции, программирования и многих других сфер;
▪️ ИИ-репетиторы теперь доступны 24/7 всем, у кого есть доступ в интернет. Они могут в реальном времени давать студентам персонализированный фидбек;
▪️ Нейросети могут адаптировать подходы к обучению с учетом особенностей каждого человека. Например, для людей с дислексией ИИ может автоматически переводить текст в речь;
▪️ Информация теперь все время под рукой. Можно не запоминать ее, а сразу пытаться применить знания на практике;
▪️ В новой парадигме преуспеют самые мотивированные студенты, которые могут учиться самостоятельно;
▪️ ИИ-модели могут давать как верные ответы, так и совсем неправильные. Учителям нужно будет оптимизировать процесс обучения с учетом этого факта;
▪️ ИИ поможет преподавателям готовить персонализированные учебные планы и материалы, проверять домашние задания, отслеживать посещаемость;
▪️ Учителя станут коучами, тьюторами и наставниками, которые не просто доносят информацию, а создают более располагающую атмосферу в классе, в том числе виртуальном.

💸 Молодые люди уже начинают задумываться, а стоит ли высшее образование их вложений (не только денег, но и времени). Поэтому университеты будущего должны будут воспринимать обучение как сервис, а студентов — как своих клиентов. Самым важным для них будет найти дифференциаторы (ключевые отличия от конкурентов), чтобы гарантировать учащимся максимальный возврат инвестиций.

🤝 Образовательным учреждениям сегодня нужно сотрудничать с лидерами в области технологий, а не сталкиваться с ними лбами. ИИ может стать для вузов или попутным ветром, или встречным. Наличие технических ресурсов, таких как доступ к GPU, вероятно, станет ключом к лидерству.

🖌 ИИ будет топливом для студенческого творчества и инноваций. Он может сократить непосредственное участие человека в некоторых дисциплинах и при этом освободить его интеллект и изобретательность — а это основная сила, которая стоит за появлением новых идей.
🔥5🤔3
Apple хочет внедрить ИИ в Vision Pro, в ElevenLabs «воскрешают» знаменитых актеров, удалять AI-контент с YouTube будет проще — и другие важные новости за неделю

Яндекс начал маркировать рекламу, созданную генеративным ИИ. В 2023 году предприниматели получили возможность бесплатно добавлять в свои рекламные объявления креативы от нейросети YandexART. К июню этого года опцией воспользовались больше 11% активных рекламодателей в Директе. Теперь на такой интернет-рекламе можно будет увидеть пометку, нажав на три точки в верхнем правом углу объявления;

Apple планирует внедрить свою ИИ-систему Apple Intelligence в Vision Pro, пишет Bloomberg. На недавней конференции WWDC компания рассказала, что ИИ появится в iPhone, iPad и Mac, а про гарнитуру речи не было — это приятный сюрприз для пользователей. Но рассчитывать на обновление в этом году не стоит. Компании еще предстоит понять, как новые фичи могут выглядеть в виртуальной реальности;

YouTube теперь позволяет запрашивать удаление AI-контента, который копирует ваши лица и голоса. Раньше можно было только требовать удалить дипфейки, если они «вводят в заблуждение». Теперь можно сослаться на нарушение конфиденциальности. Но сам запрос не означает, что контент точно уберут. YouTube будет изучать такие ролики и учитывать их ценность, кого именно они изображают, в каком виде и так далее;

Figma временно отключает ИИ-функцию, которая копирует дизайны Apple. Make Design позволяла генерировать макеты и UI-компоненты на основе текстовых промптов. Вот только основатель NotBoring Software в процессе тестирования обнаружил, что функция неоднократно воспроизводила приложение Weather от Apple. Make Designs вроде как использует GPT-4o от OpenAI и Titan Image Generator G1 от Amazon. Если это правда, возникает вопрос, не учились ли они на разработках Apple;

В ElevenLabs «воскресили» умерших голливудских звезд для чтения текстов. Речь идет об обновлении для недавно выпущенного приложения Reader App. Теперь ИИ компании сможет зачитывать файлы пользователей голосами четырех голливудских звезд: Берта Рейнольдса, Джуди Гарланд, Джеймса Дина и сэра Лоуренса Оливье. ElevenLabs тесно сотрудничала с наследниками покойных знаменитостей, чтобы их цифровые аватары звучали так же, как когда-то они сами;

WhatsApp* разрабатывает генератор персонализированных аватаров. Новую функцию заметили в бета-версии WhatsApp для Android 2.24.14.7. Пользователям нужно будет загружать изображения и писать текстовые промпты, а Meta** Llama выдаст готовые аватары. Так можно будет представить себя в любой локации, от леса до космоса. В общем, новая опция напоминает нашумевшее приложение Lensa AI. Правда, пока непонятно, когда она выйдет в паблик.

*WhatsApp входит в Meta — организацию, запрещенную на территории РФ
**Организация, запрещенная на территории РФ
👍3
⚠️ Microsoft, Meta*, Nvidia предупредили инвесторов о рисках ИИ

Не менее десятка крупных техкомпаний добавили в последние финансовые отчеты предупреждения, связанные с ИИ.

✍️Предупреждения публикуются в разделе «Факторы риска». В нем компании описывают, что может пойти не так, пытаясь предотвратить судебные иски акционеров.

🔸Alphabet заявила, что использование ее ИИ-сервисов «может негативно повлиять на права человека, конфиденциальность, рынок труда или другие социальные проблемы», что приведет к судебным искам или финансовому ущербу
🔸Meta* предупредила, что некоторые люди могут использовать ИИ компании для распространения дезинформации во время выборов, что повредит имиджу бренда
🔸Microsoft заявила, что может столкнуться с исками художников, музыкантов и писателей о нарушении авторских прав со стороны ИИ.

✂️Иногда предупреждения компаний идут вразрез с их официальной линией. Adobe давно говорит о том, что Photoshop и подобные программы останутся ключевыми для творческих профессионалов. Но уже в этом году компания предупредила, что распространение ИИ может повредить рынку труда и нарушить спрос на существующее ПО.

🔮Некоторые риски, о которых говорят компании, сбываются. Nvidia с начала 2023 года предупреждала, что опасения по поводу ИИ могут привести к ограничениям на ее продукты. После этого правительство США ограничило экспорт передовых компьютерных чипов в Китай, включая чипы Nvidia.

*Организация, запрещенная на территории РФ
🔥2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
👗Bershka предложили составлять и носить виртуальный гардероб

Бренд интегрировал 25 AR-фильтров на базе Snap в свое приложение. Пользователи могут собрать и виртуально примерить весь аутфит целиком, а не отдельную вещь. Также можно включить фильтры во время видеосъемки, чтобы лучше оценить, как одежда смотрится в реальной жизни.
👍3🤔2🔥1
🎈 Sequoia Capital: ИИ — финансовый пузырь, и он рискует лопнуть

Огромные инвестиции техгигантов в инфраструктуру ИИ пока не привели к росту доходов от этого бизнеса, считает Дэвид Кан, аналитик Sequoia Capital (венчурный фонд, инвестировавший в Apple, Google, PayPal, YouTube до того, как это стало мейнстримом). Эксперт уверен, что профильным компаниям нужно зарабатывать гораздо больше, чтобы окупить вложения.

💎Производитель Nvidia заработал в 2023 году $47,5 млрд на продажах оборудования для ЦОД (в основном, ИИ-ускорителей). При этом доходы от ИИ у основных клиентов компании гораздо скромнее. Сюда входят AWS, Google, Meta*, Microsoft и многие другие. Лишь OpenAI, пользующаяся инфраструктурой Microsoft Azure, смогла значительно увеличить доходы с $1,6 млрд в 2023 году до $3,4 млрд в 2024 году.

💰 Кан считает, что ИИ-компаниям нужно зарабатывать около $600 млрд в год, чтобы компенсировать расходы на инфраструктуру. Чтобы рассчитать сумму покрытия общих затрат на ЦОД, аналитик увеличил вдвое прогноз текущих доходов NVIDIA. Результат он вновь удвоил — полученная сумма должна обеспечить половину валовой прибыли конечных потребителей ИИ-сервисов от AWS или Microsoft Azure.

🤑 Даже если Google, Microsoft, Apple и Meta* будут ежегодно зарабатывать по $10 млрд на ИИ-сервисах, а такие компании, как Oracle, ByteDance, Alibaba, Tencent, X и Tesla — по $5 млрд, останется еще $500 млрд затрат, которые нужно окупить. Дэвид Кан считает, что это говорит о росте финансового пузыря.

♻️ Чтобы избежать катастрофы на рынке, Кан предложил снизить ожидания быстрой прибыли от ИИ и сфокусироваться на устойчивых инновациях и создании действительно ценного продукта для конечных пользователей.

*Организация, запрещенная на территории РФ
🤔3
Верхний ряд: оригинальные изображения. Нижний ряд: изображения, реконструированные ИИ на основе записей мозга макаки.

🧠 ИИ научился читать мысли с фотографической точностью

👁 Нидерландские ученые разработали систему, которая по данным активности мозга может сказать (и показать), что человек увидел за день. Для этого использовали функциональные МРТ-сканеры (фМРТ) и имплантированные электроды, которые фиксировали активность мозга и переводили ее в изображения.

🏞В одном эксперименте участвовали три человека, которые просматривали серию фотографий. Технология проанализировала данные об активности их мозга и превратила сигналы в реалистичные картинки. Аналогичный эксперимент провели с обезьяной, ​​только она смотрела на изображения, созданные ИИ.

🤖Результаты также показали, что ИИ гораздо легче воссоздать изображения, сгенерированные нейросетью, чем изображения, полученные без помощи технологий. Систему обучили фокусироваться на определенных частях мозга, что значительно повысило точность воссозданных изображений.

🗣 Ранее японские ученые с помощью фМРТ уже проводили подобные эксперименты, но тогда результаты были скромнее.
3
This media is not supported in your browser
VIEW IN TELEGRAM
🚘 Пользователь Reddit в одиночку сделал видеорекламу Volvo с помощью нейросети

Автор показал коммерческий потенциал модели RunwayML Gen-3 Alpha, создав с помощью нее целый рекламный ролик. По его словам, проект занял 24 часа, включая создание, редактирование, ретушь и звуковой дизайн клипа. Небольшие изменения автор внес в Adobe After Effects: логотип, номера машины и др.

😎 Автор называет версию Gen-3 большим шагом вперед по сравнению с Gen-2. Он также уверен, что Gen-3 изменит индустрию видеопродакшена.

🧸 Ранее крупнейший в США ритейлер в сфере игрушек Toys R Us представил рекламный ролик, почти полностью сгенерированный нейросетью Sora.
🔥71🤔1
📈 OpenAI оценил свои технологии на 2 из 5

Компания создала внутреннюю шкалу для отслеживания развития ИИ-разработок. Существующие чат-боты, такие как ChatGPT, находятся на 1 уровне. OpenAI считает, что ее технологии уже приближаются к уровню 2, когда система может решать базовые задачи на уровне человека с докторской степенью.

На уровне 3 ИИ может выполнять действия от имени пользователя, на уровне 4 — создавать инновации. Уровень 5 — система, которая может выполнять работу вместо целых организаций. ИИ 5 уровня — последний шаг к достижению пресловутого AGI. Компания не раскрыла подробностей того, как ее разработкам будет присуждаться тот или иной уровень прогресса.

🤓 По данным Bloomberg, руководство компании в ходе собрания представило итоги проекта, где GPT-4 демонстрирует новые навыки «человеческого мышления».

🌟 Достичь AGI — одна из ключевых миссий OpenAI. При этом компания учитывает, что есть и другие ИИ-проекты, которые стремятся к той же цели. В уставе OpenAI сказано, что если другой проект, «ориентированный на ценность и безопасность, приближается к созданию AGI» раньше, чем это сделает OpenAI, компания прекратит конкурировать и поспособствует развитию проекта.

🧠 Для AGI потребуются миллиарды долларов на вычислительные мощности. И хотя идея суперинтеллекта звучит невероятно, главы техкомпаний предсказывают его наступление уже в ближайшие годы. В 2023 году Сэм Альтман заявил, что осталось «плюс-минус пять лет», прежде чем мы достигнем AGI. Основатель SingularityNET Бен Гертцел допускает, что AGI может появиться в 2027 году. А экс-инженер Google Джеффри Хинтон считает, что до появления AGI осталось 5-20 лет.
2🤔1
В Photoshop и WhatsApp теперь можно редактировать фото по промптам, Xiaomi запустил круглосуточную ИИ-фабрику без людей — и другие важные новости за неделю

Photoshop добавил ИИ-плагин Magniific. С его помощью можно повысить разрешение любой картинки в 16 раз до 4К. Скоро добавят режимы Style Transfer и Relight, чтобы менять фильтры, стили, погоду, время суток и освещение по текстовым промптам;

WhatsApp* также тестирует функцию редактирования фото с помощью текстовых команд. Пользователям нужно загрузить фото в чат с Meta** AI. Нейросеть может определить объекты на фото, объяснить смысл изображения или быстро отредактировать фото;

Китай занял первое место по внедрению генеративного ИИ, по данным аналитиков SAS и Coleman Parkes. Технологию используют 83% опрошенных китайских компаний — это больше, чем в 16 других странах и регионах. Для сравнения, в США нейросети используют 65% компаний, а средний показатель по миру составил 54%;

Xiaomi показал полностью роботизированную фабрику по сборке смартфонов. Она будет работать круглосуточно без людей и собирать по одному смартфону в секунду. Площадь фабрики — 80 тыс. кв метров, ожидаемая производительность — более 10 млн аппаратов в год;

Американский производитель микросхем AMD покупает финский стартап Silo AI за $665 млн. Silo AI — крупнейший ИИ-стартап в Европе, среди его клиентов — Philips, Rolls-Royce и Unilever. Таким образом AMD хочет усилить свои позиции на рынке и обойти главного конкурента — Nvidia;

Ipsos изучил отношение потребителей во всем мире к ИИ. 53% опрошенных говорят, что им нравятся ИИ-продукты и услуги, при этом у 50% респондентов нейросети вызывают опасения. В Азии интерес к ИИ выше, в то время как англоговорящие страны и Европа настроены более скептически;

Гонконг хочет изменить закон об авторском праве для развития ИИ. Власти могут разрешить ИИ использование онлайн-контента, защищенного авторским правом, для машинной обработки. Город стремится стать региональным центром торговли интеллектуальной собственностью;

OpenAI закрывает доступ к API в Китае и некоторых других странах. Блокировка приведет к переходу китайских разработчиков на локальные альтернативы. Так, компания Baidu планирует запустить бесплатный доступ к нейросети Ernie, а компания Zhipu AI запустит «специальную программу миграции» для пользователей OpenAI.

*WhatsApp входит в Meta — организацию, запрещенную на территории РФ
**Организация, запрещенная на территории РФ
1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Японец показал чудеса владения нейросетями

Арата Фукое любит экспериментировать с видео (и даже был одним из амбассадоров камер GoPro в стране), а в последнее время заинтересовался генеративным ИИ.

🫡 У себя в соцсетях он выложил видео, почти полностью созданное нейросетями (почти, потому что не обошлось без фотошопа и After Effects).

📹 За видеоряд отвечали: Kling, Gen-3 и DreamMachine. Они анимировали изображения, сгенерированные Stable Diffusion и Midjourney.

🎧 ChatGPT и Suno обеспечили саундтрек.

🙏 Фукое клянется, что при создании ролика ни одного «живого» кадра не использовал.

🖱 На сайте автора можно также посмотреть его эксперименты с нерфами (один из них создан при помощи трех десятков GoPro).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
💪 Самый наглядный пример того, как генеративный ИИ прокачался за год

Помните нейрорекламу несуществующей пиццерии Pepperoni Hug Spot, выполненную в лучших традициях роликов с Уиллом Смитом, поедающим макароны?

🔩 Ее автор выпустил римейк, использовав вместо нейросети Gen-2, только что вышедшую Gen-3.

🔮 Страшно представить, каким будет ролик в 2025 году.
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔈 Heygen научился оживлять аватары по аудио

Стартап запустил бета-тест новой функции Expressive Photo Avatars.

1️⃣ Выбираете изображение с аватаром.

2️⃣ Добавляете аудио с речью продолжительностью от 3 до 30 секунд (можно загружать и музыку).

3️⃣ На выходе получаете анимацию, сгенерированную с учетом «эмоционального настроя» аудио.

🫡 Попробовать можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 Стилизация видео нейросетями в прямом эфире

Live2Diff позволяет редактировать видео прямо во время лайв-стрима, используя диффузионную нейросеть.

😱 Авторы считают свою технологию прорывной. Они объясняют, что обычные нейросети не могут корректно работать с живым видео, так как им нужно четко представлять, что будет происходить в видео дальше.

🤯 Live2Diff достаточно несколько кадров, чтобы на их основе дальше выдавать консистентную и плавную картинку.

🤟 Чудес от работы модель ждать пока не стоит. Разработчики уточняют, что это их первая попытка, которая в большей степени должна показать, что метод работает.

🔩 Сейчас Live2Diff на топовом GPU RTX 4090 выдает 16 кадров.

🗓 В ближайшие дни обещают выложить код на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21😱1
🎧 Яндекс Музыка научилась распознавать редкие жанры музыки с помощью ИИ

Стриминг-сервис с помощью нейросетей и музыкальных экспертов научился советовать пользователю исполнителей малоизвестных жанров: мумбатон, детройтское техно, ню-джаз и т.д.

🔩 Сначала редакторы сервиса определили редкие музыкальные жанры, затем музыкальные эксперты подобрали под них треки.

На основе выбора экспертов для каждого жанра создали ML-разметку (грубо говоря, датасет, где каждый трек помечен соответствующим ему жанром), по которой техническая команда стриминг-сервиса обучала нейросеть.

🔎 Яндекс обещает, что система рекомендаций и для малоизвестной музыки останется персонализированной — то есть даже в самых нишевых жанрах система должна найти треки, которые вероятнее всего понравятся слушателю.

🗺 Посмотреть, какие жанры теперь знает Яндекс Музыка, можно в разделе Тренды стриминг-сервиса или на интерактивной карте.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Люди очеловечивают чат-ботов, Европейцы не получат доступ к новым ИИ-моделям Meta*, названа дата выхода самой мощной версии Llama 3 — и другие важные новости за неделю

OpenAI запрещал сотрудникам публично говорить о потенциальной опасности, которую разработки стартапа могут нести для человечества. Запрет был не словесным — работники подписывали документ о неразглашении. Сотрудники также были обязаны предварительно уведомить OpenAI, если им вдруг придет в голову пойти в госорганы, чтобы предупредить об опасных (по мнению сотрудников) разработках;

Британские исследователи на основе опроса 300 респондентов сделали вывод, что большинство пользователей склонны очеловечивать чат-ботов — наделять их памятью и чувствами. Авторы исследования считают, что это может привести к негативным последствиям — эмоциональной привязанности и чрезмерной зависимости от ИИ при принятии важных решений;

Самая мощная версия опенсорсной языковой модели Llama 3 выйдет уже 23 июля. У мультимодальной LLM будет 405 млрд параметров. Предрелизная версия показала себя чуть хуже топовых LLM от Google, OpenAI и Anthropic. Весной Meta выпустила версии Llama 3 с 8 млрд и 70 млрд параметров;

На этой неделе также стало известно, что Meta не будет давать доступ к своим мультимодальным моделям с открытым кодом на территории ЕС. В компании объяснили это слишком запутанной регуляторной политикой на территории Евросоюза в отношении ИИ. За несколько недель до этого Apple объявил, что тоже пока не собирается запускать ИИ-функции (Apple Intelligence) новой версии iOS на территории ЕС — по той же причине;

Журналисты выяснили, что бигтехи без спроса тренируют ИИ-модели на расшифровках видео с YouTube. Издание Wired обнаружило целый датасет с текстовыми версиями видео с популярных каналов. На его использовании попались Apple, Nvidia, Anthropic и другие. Такое использование ютубовского контента прямо нарушает правила платформы. В Apple уже заявили, что ничем таким не занимаются;

Рыночная капитализация Nvidia может достигнуть $50 трлн, считает инвестор Бейли Гиффорд. Звучит безумно, учитывая, что компания только-только преодолела отметку в $3 трлн. Но если кому и делать такие заявления, так это Гиффорду. Он был одним из первых инвесторов Tesla и Amazon, а активы под его управлением принесли инвесторам больше 2000% прибыли. Инвестор уточняет — такой стоимости компания может достичь, если ИИ станет по-настоящему полезным для обычных пользователей, а Nvidia к тому моменту все еще будет в лидерах.

*Организация, запрещенная на территории РФ
👍1
🔎 Из датасетов для обучения ИИ пропало до 30% информации

Выяснили исследователи из MIT. В своей работе они проанализировали 14 тыс. веб-доменов. Информация именно с этих доменов попадает в самые крупные датасеты для обучения ИИ (C4, RefinedWeb, Dolma и другие). Эти датасеты скачали от 100 тыс. до более чем 1 млн раз.

📚 В датасете Dolma, например, содержится 3 трлн токенов информации.

✈️ Авторы исследования подсчитали, что за 2023–2024 годы около 5% от всего количества токенов информации в датасете C4 оказались под запретом из-за действий владельцев ресурсов (откуда информация получена). Это значит, что владельцы тем или иным образом запретили собирать информацию с их сайта для обучения ИИ.

💎 Если 5% не кажется серьезной цифрой, то важно отметить, что этот показатель составляет почти 30% для информации из «высококачественных» источников. Такая информация критически важна для ИИ, чтобы модель могла выдавать точные ответы на запросы пользователей. Это могут быть, скажем, уважаемые СМИ, которые публикуют только проверенную информацию.

📆 Конечно, это не значит, что датасеты в прямом смысле потеряли эту информацию. Но это значит, что они, вероятно, не смогут получать обновленные, актуальные данные для обучения ИИ-моделей. А значит, сами модели могут стать в какой-то момент устаревшими.

🔒 Исследование MIT затрагивает критически важную для всего ИИ-сегмента проблему дефицита информации, о которой говорят не первый год. Но если раньше речь шла в основном о том, что новая информация для обучения закончится естественным путем (ИИ просто узнает все, что можно узнать), то теперь свою роль играют и владельцы информации.

😢 В этой ситуации мало кому жалко бигтехи, которые тратят десятки миллионов долларов на сделки, обеспечивающие их LLM данными. Датасетами также пользуется научное сообщество, стартапы и НКО, которым теперь будет тяжелее обучить модель.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
🆕 В Dream Machine появился продвинутый генератор зацикленных видео

🔩 Теперь нейросеть сможет сгенерировать луп по текстовой подсказке, изображению-референсу, ключевому кадру.

Можно и просто сделать зацикленный видос из готового клипа.

🫡 Dream Machine все еще можно потестить бесплатно после регистрации.

🎞 Недавно нейросеть научилась генерировать видео по нескольким ключевым кадрам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1