Data Scientist | IT
1.94K subscribers
651 photos
3 videos
1 file
707 links
Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia
Download Telegram
Как оживить Кандинский матрицами вращений

#почитать

В чем же проблема при генерации видео из текста? В отличие от генерации картинки, вам необходимо получить серию максимально близких изображений, в которых есть малые изменения заданные самим текстом.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
Обучение с подкреплением на основе обратной связи от человека. История становления идеи

#почитать

Мы накопили уже достаточно доказательств и исследований о том, что большие языковые модели (LLM) по умолчанию сами по себе на самом деле не соответствуют человеческим интересам и ценностям. Я уверена, я не первая, кто говорит о том, что такие модели могут быть невероятно предвзятыми. Мы знаем, что они генерируют ложную информацию и «галлюцинируют», демонстрируют политические и моральные предубеждения.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Подготовка будущих аналитиков данных и ML-специалистов к реальным бизнес-задачам

#почитать

Будущие аналитики данных, BI‑аналитики, ML‑разработчики и Data Scientists используют готовые датасеты для выполнения студенческих заданий, чтобы научиться понимать принципы обработки данных, искать и валидировать гипотезы, строить предсказательные модели.

Однако задачи, которые решают студенты, часто недостаточно полезны как для них самих, так и для владельцев данных. Студенты не получают опыт решения практических задач, а также понимания, что результат их работы может быть полезен для бизнеса. В статье разбираюсь, почему так происходит и как получить опыт, который пригодится в работе.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Задача распознавания эмоций: три кита качества

#почитать

В этой части мы коротко поговорим о данных, о работе сверточных нейросетей и о глобальных параметрах. От том что такое СГС и почему нельзя решать задачу в виде линейного уравнения. Затронем тему оптимизаторов и ответим на вопрос почему нельзя просто использовать обычный градиентный спуск. В общем обо всех деталях коротко и структурно.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Дизайнер интерьеров Stable Diffusion

#почитать

В сценарии существующего процесса клиент обращается к менеджеру по продажам с запросом на ремонт квартиры. Традиционный подход включает предложение клиенту описания работ, мудбордов и стилевых рекомендаций, после чего клиент вступает в процесс с дизайнерами, чтобы увидеть окончательное воплощение идей через определенное время. Вроде бы всё просто и понятно. Но во‑первых, это долго. Во‑вторых, не всегда команды дизайнеров свободны и процесс может растянуться на недели (!). В целом, да, всё сводится к тому, что это долго. А где много человеко‑часов, там ещё и много затрат.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71
Библиотеки Python для машинного обучения — подборка для начинающих

#почитать

Составили список самых важных библиотек Python для машинного обучения и рассказали, для каких задач они могут быть полезны начинающим ML-инженерам.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61
Как обучают GPT

#почитать

Transformer — по-настоящему революционная архитектура. Она впервые появилась на страницах культовой статьи Attention Is All You Need («Внимание — все, что вам нужно»), которую написали Ашиш Васвани и его коллеги из Google. Они предложили сетевую архитектуру без рекурсии и сверток, основанную исключительно на механизмах внимания. До этого в основе популярных моделей преобразования последовательностей чаще всего были сложные рекуррентные или сверточные нейросети.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥31
Prompt engineering 101

#почитать

Разберемся с тем, как вообще устроены LLM, затем поговорим о промптах: общие принципы построения, техники оптимизации и промпты для изображений. А на десерт предложим вам продвинутые техники работы с LLM: автоматизированные подходы по улучшению промптов, Retrieval‑Augmented Generation и разметка данных для ML с помощью LLM.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍2
Генеративное глубокое обучение

Автор:
Дэвид Фостер
Год издания: 2020

#ru #deeplearning #python

Скачать книгу
🔥5👍2
Графовые сети в рекомендательных системах

#почитать

Что такое сверточные графовые сети, их основные компоненты и принципы работы: подробно разберем модель на user-item графе, после перейдём к item-item графу;

Знакомство с моделью LightGCN: архитектура, процесс обучения, недостатки (медленная сходимость и смещение в популярное) и варианты их устранения;

Как это всё применять на практике: обучим сетку на датасете Movielens-25m, замерим метрики, столкнёмся с проблемами LightGCN и вместе их решим

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
Алгоритмы неформально.
Инструкция для начинающих питонистов

Автор:
Брэдфорд Такфилд
Год издания: 2022

#algorithms #python #ru

Скачать книгу
👍61🔥1
▫️ Деревья и их ансамбли 2023 | Деревья в анализе данных

#посмотреть

Open ML Course.

Смотреть на YouTube 30 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Машинное обучение с использованием Python. Сборник рецептов

Автор:
Крис Элбон
Год издания: 2019

#ml #python #ru

Скачать книгу
7
Промпт-инженеринг — новый хайп или перспективная профессия?

Рассказываем про направление с большим потенциалом и маленькой конкуренцией на рынке на нашей бесплатной лекции.

По итогам эфира вы узнаете:
— Кто такой промт-инженер и чем он занимается;
— Как интегрировать скиллы промт-инжинеринга в работу, если вы работаете в IT;
— Кому в действительности нужны его услуги и какие результаты это даст;
— Сколько платят промт-инженеру в России и мире;
— Кто может стать промт-инженером и какой порог входа;

Кликай на ссылку и забирай подробную информацию вместе с классными бонусами.

ООО Зерокодер, ИНН 9715401631, erid: LjN8KQ8mP
👍6
Python для Data Science

Автор:
Юлий Васильев
Год издания: 2023

#python #ru #datascience

Скачать книгу
👍5👎1
Полезный блог про iGaming, который ведет СЕО 1win! 💙

Канал Owner 1win — про философию управления из первых уст. Простыми словами о сложном iGaming.

Тут ты найдешь:

⚡️ Гемблинг-инсайды
⚡️ Бизнес-советы
⚡️ Экспертные комментарии овнера
⚡️ Апдейты по проектам

Присоединяйся к Owner 1win и будь на волне iGaming трендов
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2
📖The Little Book of Deep Learning

Книжка-шпаргалка для быстрой подготовки к собеседованиям по DL.

Скачать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
GenAI, кино и Голливуд

Наткнулся на интересные мысли от Doug Shapiro по поводу перспектив использования генеративного AI в большом кино. Перспективы так себе — Doug уверен, что мы ещё очень нескоро увидим новый голивудский блокбастер «снятый» с помощью нейросети. И я ему верю, этот автор умеет анализировать огромный объем информации и делать четкие выводы.

Вот несколько ключевых мыслей:

📌 GenAI имеет множество потенциальных применений в традиционном процессе производства фильмов и ТВ шоу. Помощь в написании сценариев, генерация концепт-арта, автоматизация процессов видеосъемки или перевода на множество языков. Но это лишь дополнительные инструменты для пре- и постпродакшена.

📌 Наиболее мощными преобразующими инструментами, с точки зрения сокращения времени, рабочей силы и затрат, являются видеогенераторы с искусственным интеллектом, которые могут частично или полностью заменить основную съемку.

📌 Модели видео с использованием искусственного интеллекта развиваются с огромной скоростью. В феврале OpenAI потряс индустрию анонсом Sora. В прошлом месяце Google анонсировала Veo, а всего за последнюю неделю или около того было выпущено или анонсировано множество столь же впечатляющих моделей следующего поколения, включая Kling, Dream Machine и Runway Gen-3.

📌 Какими бы впечатляющими ни были эти модели, студии еще очень долго не смогут использовать их для замены основной съемки, даже если захотят, по трем причинам: трудовые отношения, важные нерешенные юридические вопросы и технические ограничения.

📌 Если в Кремниевой долине принято говорить “действуй быстро чтобы добиться успеха”, то в Голливуде принято говорить “лучше сначала обратиться к юристам”. Существует множество нерешенных юридических вопросов, связанных с ИИ, но наиболее насущные из них касаются нарушения авторских прав и интеллектуальной собственности. Для крупных студий использование искусственного интеллекта, обученного на чужих авторских правах, является проигрышным: они либо нарушают, либо подрывают свои собственные права.

Ключевой вывод, который делает автор — GenAI не заменит Голливуд, но есть большой риск, что он его «задизраптит». Для дизрапта требуются два основных компонента: прорывные инновации, которые снижают барьеры для входа, и существующие игроки рынка, которые не могут отреагировать. Здесь есть и то, и другое.

Продукторий Владимира Меркушева
5👌2
Исследование: турецкие школьники глупеют от использования ChatGPT

#почитать

Исследователи из Пенсильванского университета обнаружили, что турецкие старшеклассники, у которых был доступ к ChatGPT при выполнении практических математических задач, показали худшие результаты в тесте по сравнению с учениками, у которых не было ChatGPT.

Те, у кого был ChatGPT, верно решили на 48% больше практических задач, но в конечном итоге набрали на 17% меньше баллов на тесте по теме, которую изучали.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
Что можно узнать из текста в телеграмм-канале

#почитать

И вот, спустя 2 года, мне пришло в голову, что телеграмм-канал - это довольно необычный источник текстов. Я у мамы дата сайнтист, так что на этих данных и решил устроить себе небольшой NLP-этюд


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
Модели замены фона видеосозвонов

#почитать

Что мы хотим в идеале получить от маттинга? Картинку, когда мы берем изображение, убираем все, что относилось к фону, и останется передний план, который можно будет перенести на новое изображение. Если делать это наивно, то просто возьмем альфа-канал, умножим его на изображение и получим что-то похожее на передний план. Но на границе, где альфа-канал не равен 1 или 0, у нас появятся артефакты.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52