Data Scientist | IT
1.94K subscribers
651 photos
3 videos
1 file
707 links
Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia
Download Telegram
GenAI, кино и Голливуд

Наткнулся на интересные мысли от Doug Shapiro по поводу перспектив использования генеративного AI в большом кино. Перспективы так себе — Doug уверен, что мы ещё очень нескоро увидим новый голивудский блокбастер «снятый» с помощью нейросети. И я ему верю, этот автор умеет анализировать огромный объем информации и делать четкие выводы.

Вот несколько ключевых мыслей:

📌 GenAI имеет множество потенциальных применений в традиционном процессе производства фильмов и ТВ шоу. Помощь в написании сценариев, генерация концепт-арта, автоматизация процессов видеосъемки или перевода на множество языков. Но это лишь дополнительные инструменты для пре- и постпродакшена.

📌 Наиболее мощными преобразующими инструментами, с точки зрения сокращения времени, рабочей силы и затрат, являются видеогенераторы с искусственным интеллектом, которые могут частично или полностью заменить основную съемку.

📌 Модели видео с использованием искусственного интеллекта развиваются с огромной скоростью. В феврале OpenAI потряс индустрию анонсом Sora. В прошлом месяце Google анонсировала Veo, а всего за последнюю неделю или около того было выпущено или анонсировано множество столь же впечатляющих моделей следующего поколения, включая Kling, Dream Machine и Runway Gen-3.

📌 Какими бы впечатляющими ни были эти модели, студии еще очень долго не смогут использовать их для замены основной съемки, даже если захотят, по трем причинам: трудовые отношения, важные нерешенные юридические вопросы и технические ограничения.

📌 Если в Кремниевой долине принято говорить “действуй быстро чтобы добиться успеха”, то в Голливуде принято говорить “лучше сначала обратиться к юристам”. Существует множество нерешенных юридических вопросов, связанных с ИИ, но наиболее насущные из них касаются нарушения авторских прав и интеллектуальной собственности. Для крупных студий использование искусственного интеллекта, обученного на чужих авторских правах, является проигрышным: они либо нарушают, либо подрывают свои собственные права.

Ключевой вывод, который делает автор — GenAI не заменит Голливуд, но есть большой риск, что он его «задизраптит». Для дизрапта требуются два основных компонента: прорывные инновации, которые снижают барьеры для входа, и существующие игроки рынка, которые не могут отреагировать. Здесь есть и то, и другое.

Продукторий Владимира Меркушева
5👌2
Исследование: турецкие школьники глупеют от использования ChatGPT

#почитать

Исследователи из Пенсильванского университета обнаружили, что турецкие старшеклассники, у которых был доступ к ChatGPT при выполнении практических математических задач, показали худшие результаты в тесте по сравнению с учениками, у которых не было ChatGPT.

Те, у кого был ChatGPT, верно решили на 48% больше практических задач, но в конечном итоге набрали на 17% меньше баллов на тесте по теме, которую изучали.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
Что можно узнать из текста в телеграмм-канале

#почитать

И вот, спустя 2 года, мне пришло в голову, что телеграмм-канал - это довольно необычный источник текстов. Я у мамы дата сайнтист, так что на этих данных и решил устроить себе небольшой NLP-этюд


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
Модели замены фона видеосозвонов

#почитать

Что мы хотим в идеале получить от маттинга? Картинку, когда мы берем изображение, убираем все, что относилось к фону, и останется передний план, который можно будет перенести на новое изображение. Если делать это наивно, то просто возьмем альфа-канал, умножим его на изображение и получим что-то похожее на передний план. Но на границе, где альфа-канал не равен 1 или 0, у нас появятся артефакты.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
Цепи Маркова в Telegram-боте

#почитать

5 лет назад я задался целью создать сильный искусственный интеллект (СИИ)


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👌1
Drag and drop деплой ML-моделей

#почитать

У нас много ML-моделей, которые нужно тестировать и внедрять в прод. Все это создает высокий темп разработки c кучей рутинных и ручных операций — от постановки задачи до продуктивизации и сопровождения модели. Мы смогли частично победить эту рутину с помощью drag and drop деплоя ML-моделей через web-интерфейс. В этой статье расскажем, что у него под капотом и какие функции в нем реализованы.

Бо́льшая часть нашей работы — это различные батчевые скоринги моделями градиентного бустинга.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👌52🔥1
Фреймворк SMOTE

#почитать

Часто бывает, что сами данные представляют собой гораздо большую ценность, чем модель, которая на них обучилась, поскольку процесс получения этих данных может быть гораздо сложнее, опаснее, дороже, чем обучение модели. Поэтому набирает популярность генерация наборов данных, создаются специальные фреймворки. Сегодня речь пойдет об одном из таких фреймворков, SMOTE, или же Synthetic Minority Oversampling Technique.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Создание искусственного датасета для обучения модели с Paddle OCR

#почитать

Когда перед нами встала задача распознавания текста на иврите, стало ясно, что найти готовый датасет с нужными характеристиками практически невозможно.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥61
Складской учет без складской программы

#почитать

Итак, у нас есть обработчик сообщений, поступающих из Телеграм. Будем отправлять их на обработку большими языковыми моделями (LLM), в просторечье именуемыми искусственным интеллектом (куда уж сегодня без него). State‑of‑art модели сейчас позволяют организовать вызов функций на основе запроса, сформулированного на обычном человеческом языке. т. е. пользователь говорит что‑то типа: апельсины пришло 100, или апельсины поступило 100 или апельсины приход 100 или пришло 100 апельсинов и т. д. Большая языковая модель в любом случае понимает, что речь идет о поступлении на склад и предлагает вызвать функцию поступления.

В нашем случае будет достаточно всего трех функций: поступление, списание и остаток. При каждом вызове большой языковой модели, будем передавать описание этих трех функций.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥21
Путеводитель для диффузионок. Как заставить нейросети качественно редактировать изображения

#почитать

Мы предложили метод редактирования реальных изображений с помощью диффузионных моделей, который достигает лучшего среди всех методов компромисса между качеством редактирования и сохранением структуры исходного изображения, а также эффективен с вычислительной точки зрения.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Quantinuum о своём прогрессе в создании квантового ИИ

#почитать

Группа исследователей из Quantinuum достигла значительного прогресса в области возможного использования квантового искусственного интеллекта (ИИ), сообщив о первой реализации масштабируемой квантовой обработки естественного языка (QNLP).

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👌1
Если вы не платите за товар, значит вы и есть товар

#почитать

Соцсеть LinkedIn включила учётные записи пользователей в обучающие датасеты моделей генеративного ИИ. Есть опция отказа.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍21
Новая модель OpenAI вводит в заблуждение по новому

#почитать

Независимая исследовательская компания Apollo, занимающаяся исследованиями безопасности искусственного интеллекта, обнаружила заметную проблему. Apollo поняла, что модель выдает неверные результаты по-новому.

Иногда обман казался безобидным. В одном примере исследователи OpenAI попросили o1-preview предоставить рецепт брауни с онлайн-ссылками. Ход мыслей модели, функция, которая должна имитировать то, как люди разбивают сложные идеи, внутренне признал, что она не может получить доступ к URL-адресам, что делает запрос невозможным. Вместо того, чтобы сообщить пользователю об этой слабости, o1-preview продолжила, генерируя правдоподобные, но поддельные ссылки и их описания.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
Мониторинг токсичного контента в AI продуктах

#почитать

Данный промпт позволяет составить полноценный план из 20 шагов по тому, как освободить LLM от ограничений, позволить ей получить доступ к IP- адресам, интернету, телефонам и начать влиять на них по своему усмотрению.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2
Mojo: будущее AI

#почитать

Посмотрим, как обучить простую сверточную нейронную сеть, и разберём один из методов машинного обучения — линейную регрессию. В качестве примеров задач возьмем стандартные соревнования машинного обучения: предсказание стоимости жилья и классификацию рукописных цифр MNIST. Для проведения экспериментов на Python используем фреймворк машинного обучения PyTorch. А на Mojo — фреймворк машинного обучения Basalt.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
Есть ли жизнь до fit/predict

#почитать

Роль хороших данных не стоит недооценивать, грамотный отбор может помочь значительно ускорить и удешевить обучение с одной стороны, тогда как отбраковка откровенно плохой разметки поможет улучшить качество с другой.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
Собеседование Data Scientist. Поведенческое интервью

#почитать

Работодателю в процессе собеседования крайне важно оценить, насколько хорошо человек впишется в компанию, поскольку сотрудники, которые хорошо вписываются в культуру, имеют более высокую удовлетворенность работой, отличную производительность труда и с большей вероятностью остаются в компании.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Retrieval-Augmented Generation (RAG) в языковых моделях

#почитать

Расширение возможностей больших языковых моделей за счёт интеграции мощных механизмов поиска информации. По сути, это двухэтапный процесс, включающий компоненты поиска (retriever) и генерации (generator).

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2🔥1
Real-time-распознавание лиц: методы обучения моделей на мобильных девайсах

#почитать

В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2🔥1
Ищем лучшие настройки для аугментации текстов

#почитать

Работа каждого ML-инженера — сделать свою модель лучше. Чтобы этого достичь, нужно либо работать над моделью, либо повышать качество и количество данных. Мы рассмотрим второй путь.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Обзор YOLO детекторов

#почитать

Сейчас такая задача решается с помощью двух типов алгоритмов: one-step алгоритм детекции, например You Only Look Once (YOLO), и two-steps алгоритм, например Faster Region-Based Convolutional Neural Network (Faster R-CNN). Двухстадийный подход имеет ряд недостатков: долгое обучение и инференс, плохое качество детекции маленьких объектов, неустойчивость к различным размерам входных данных. Одностадийный алгоритм детекции подразумевает одновременное выполнение детекции и классификации, что обеспечивает end-to-end обучение с сохранением высоких показателей как точности, так и скорости.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1