Data Scientist | IT – Telegram

Data Scientist | IT

@datascience_it

1.94K subscribers

651 photos

3 videos

1 file

707 links

Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia

Download Telegram

About

Blog

Apps

Platform

Data Scientist | IT

1.94K subscribers

Data Scientist | IT

Как оживить Кандинский матрицами вращений

#почитать

В чем же проблема при генерации видео из текста? В отличие от генерации картинки, вам необходимо получить серию максимально близких изображений, в которых есть малые изменения заданные самим текстом.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥1

851 views05:06

Data Scientist | IT

Обучение с подкреплением на основе обратной связи от человека. История становления идеи

#почитать

Мы накопили уже достаточно доказательств и исследований о том, что большие языковые модели (LLM) по умолчанию сами по себе на самом деле не соответствуют человеческим интересам и ценностям. Я уверена, я не первая, кто говорит о том, что такие модели могут быть невероятно предвзятыми. Мы знаем, что они генерируют ложную информацию и «галлюцинируют», демонстрируют политические и моральные предубеждения.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1🔥1

810 views10:32

Data Scientist | IT

Подготовка будущих аналитиков данных и ML-специалистов к реальным бизнес-задачам

#почитать

Будущие аналитики данных, BI‑аналитики, ML‑разработчики и Data Scientists используют готовые датасеты для выполнения студенческих заданий, чтобы научиться понимать принципы обработки данных, искать и валидировать гипотезы, строить предсказательные модели.

Однако задачи, которые решают студенты, часто недостаточно полезны как для них самих, так и для владельцев данных. Студенты не получают опыт решения практических задач, а также понимания, что результат их работы может быть полезен для бизнеса. В статье разбираюсь, почему так происходит и как получить опыт, который пригодится в работе.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1🔥1

606 views10:59

Data Scientist | IT

Задача распознавания эмоций: три кита качества

#почитать

В этой части мы коротко поговорим о данных, о работе сверточных нейросетей и о глобальных параметрах. От том что такое СГС и почему нельзя решать задачу в виде линейного уравнения. Затронем тему оптимизаторов и ответим на вопрос почему нельзя просто использовать обычный градиентный спуск. В общем обо всех деталях коротко и структурно.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

566 views05:09

Data Scientist | IT

Дизайнер интерьеров Stable Diffusion

#почитать

В сценарии существующего процесса клиент обращается к менеджеру по продажам с запросом на ремонт квартиры. Традиционный подход включает предложение клиенту описания работ, мудбордов и стилевых рекомендаций, после чего клиент вступает в процесс с дизайнерами, чтобы увидеть окончательное воплощение идей через определенное время. Вроде бы всё просто и понятно. Но во‑первых, это долго. Во‑вторых, не всегда команды дизайнеров свободны и процесс может растянуться на недели (!). В целом, да, всё сводится к тому, что это долго. А где много человеко‑часов, там ещё и много затрат.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤1

558 views10:40

Data Scientist | IT

Библиотеки Python для машинного обучения — подборка для начинающих

#почитать

Составили список самых важных библиотек Python для машинного обучения и рассказали, для каких задач они могут быть полезны начинающим ML-инженерам.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1

572 views10:33

Data Scientist | IT

Как обучают GPT

#почитать

Transformer — по-настоящему революционная архитектура. Она впервые появилась на страницах культовой статьи Attention Is All You Need («Внимание — все, что вам нужно»), которую написали Ашиш Васвани и его коллеги из Google. Они предложили сетевую архитектуру без рекурсии и сверток, основанную исключительно на механизмах внимания. До этого в основе популярных моделей преобразования последовательностей чаще всего были сложные рекуррентные или сверточные нейросети.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥3❤1

575 views10:35

Data Scientist | IT

Prompt engineering 101

#почитать

Разберемся с тем, как вообще устроены LLM, затем поговорим о промптах: общие принципы построения, техники оптимизации и промпты для изображений. А на десерт предложим вам продвинутые техники работы с LLM: автоматизированные подходы по улучшению промптов, Retrieval‑Augmented Generation и разметка данных для ML с помощью LLM.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5👍2

583 views10:42

Data Scientist | IT

Генеративное глубокое обучение

Автор: Дэвид Фостер
Год издания: 2020

#ru #deeplearning #python

Скачать книгу

🔥5👍2

653 views07:03

Data Scientist | IT

Графовые сети в рекомендательных системах

#почитать

Что такое сверточные графовые сети, их основные компоненты и принципы работы: подробно разберем модель на user-item графе, после перейдём к item-item графу;

Знакомство с моделью LightGCN: архитектура, процесс обучения, недостатки (медленная сходимость и смещение в популярное) и варианты их устранения;

Как это всё применять на практике: обучим сетку на датасете Movielens-25m, замерим метрики, столкнёмся с проблемами LightGCN и вместе их решим

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥2

664 views05:11

Data Scientist | IT

Алгоритмы неформально.
Инструкция для начинающих питонистов

Автор: Брэдфорд Такфилд
Год издания: 2022

#algorithms #python #ru

Скачать книгу

👍6❤1🔥1

740 views07:40

Data Scientist | IT

▫️ Деревья и их ансамбли 2023 | Деревья в анализе данных

#посмотреть

Open ML Course.

⏱

Смотреть на YouTube ⏱ 30 минут

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥2❤1

630 views10:34

Data Scientist | IT

Машинное обучение с использованием Python. Сборник рецептов

Автор: Крис Элбон
Год издания: 2019

#ml #python #ru

Скачать книгу

❤7

609 views07:11

Data Scientist | IT

Промпт-инженеринг — новый хайп или перспективная профессия?

Рассказываем про направление с большим потенциалом и маленькой конкуренцией на рынке на нашей бесплатной лекции.

По итогам эфира вы узнаете:
— Кто такой промт-инженер и чем он занимается;
— Как интегрировать скиллы промт-инжинеринга в работу, если вы работаете в IT;
— Кому в действительности нужны его услуги и какие результаты это даст;
— Сколько платят промт-инженеру в России и мире;
— Кто может стать промт-инженером и какой порог входа;

Кликай на ссылку и забирай подробную информацию вместе с классными бонусами.

ООО Зерокодер, ИНН 9715401631, erid: LjN8KQ8mP

👍6

632 views07:33

Data Scientist | IT

Python для Data Science

Автор: Юлий Васильев
Год издания: 2023

#python #ru #datascience

Скачать книгу

👍5👎1

634 views05:59

Data Scientist | IT

Полезный блог про iGaming, который ведет СЕО 1win! 💙

Канал Owner 1win — про философию управления из первых уст. Простыми словами о сложном iGaming.

Тут ты найдешь:

⚡️ Гемблинг-инсайды
⚡️ Бизнес-советы
⚡️ Экспертные комментарии овнера
⚡️ Апдейты по проектам

Присоединяйся к Owner 1win и будь на волне iGaming трендов

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥2

627 views12:35

Data Scientist | IT

📖The Little Book of Deep Learning

Книжка-шпаргалка для быстрой подготовки к собеседованиям по DL.

⏱

Скачать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

619 viewsedited 15:02

Data Scientist | IT

GenAI, кино и Голливуд

Наткнулся на интересные мысли от Doug Shapiro по поводу перспектив использования генеративного AI в большом кино. Перспективы так себе — Doug уверен, что мы ещё очень нескоро увидим новый голивудский блокбастер «снятый» с помощью нейросети. И я ему верю, этот автор умеет анализировать огромный объем информации и делать четкие выводы.

Вот несколько ключевых мыслей:

📌 GenAI имеет множество потенциальных применений в традиционном процессе производства фильмов и ТВ шоу. Помощь в написании сценариев, генерация концепт-арта, автоматизация процессов видеосъемки или перевода на множество языков. Но это лишь дополнительные инструменты для пре- и постпродакшена.

📌 Наиболее мощными преобразующими инструментами, с точки зрения сокращения времени, рабочей силы и затрат, являются видеогенераторы с искусственным интеллектом, которые могут частично или полностью заменить основную съемку.

📌 Модели видео с использованием искусственного интеллекта развиваются с огромной скоростью. В феврале OpenAI потряс индустрию анонсом Sora. В прошлом месяце Google анонсировала Veo, а всего за последнюю неделю или около того было выпущено или анонсировано множество столь же впечатляющих моделей следующего поколения, включая Kling, Dream Machine и Runway Gen-3.

📌 Какими бы впечатляющими ни были эти модели, студии еще очень долго не смогут использовать их для замены основной съемки, даже если захотят, по трем причинам: трудовые отношения, важные нерешенные юридические вопросы и технические ограничения.

📌 Если в Кремниевой долине принято говорить “действуй быстро чтобы добиться успеха”, то в Голливуде принято говорить “лучше сначала обратиться к юристам”. Существует множество нерешенных юридических вопросов, связанных с ИИ, но наиболее насущные из них касаются нарушения авторских прав и интеллектуальной собственности. Для крупных студий использование искусственного интеллекта, обученного на чужих авторских правах, является проигрышным: они либо нарушают, либо подрывают свои собственные права.

Ключевой вывод, который делает автор — GenAI не заменит Голливуд, но есть большой риск, что он его «задизраптит». Для дизрапта требуются два основных компонента: прорывные инновации, которые снижают барьеры для входа, и существующие игроки рынка, которые не могут отреагировать. Здесь есть и то, и другое.

Продукторий Владимира Меркушева

❤5👌2

418 views11:11

Data Scientist | IT

Исследование: турецкие школьники глупеют от использования ChatGPT

#почитать

Исследователи из Пенсильванского университета обнаружили, что турецкие старшеклассники, у которых был доступ к ChatGPT при выполнении практических математических задач, показали худшие результаты в тесте по сравнению с учениками, у которых не было ChatGPT.

Те, у кого был ChatGPT, верно решили на 48% больше практических задач, но в конечном итоге набрали на 17% меньше баллов на тесте по теме, которую изучали.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤2

360 viewsedited 09:05

Data Scientist | IT

Что можно узнать из текста в телеграмм-канале

#почитать

И вот, спустя 2 года, мне пришло в голову, что телеграмм-канал - это довольно необычный источник текстов. Я у мамы дата сайнтист, так что на этих данных и решил устроить себе небольшой NLP-этюд

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥1

362 views10:42

Data Scientist | IT

Модели замены фона видеосозвонов

#почитать

Что мы хотим в идеале получить от маттинга? Картинку, когда мы берем изображение, убираем все, что относилось к фону, и останется передний план, который можно будет перенести на новое изображение. Если делать это наивно, то просто возьмем альфа-канал, умножим его на изображение и получим что-то похожее на передний план. Но на границе, где альфа-канал не равен 1 или 0, у нас появятся артефакты.

⏱

Читать

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤2

292 views08:06