Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.25K photos
111 videos
64 files
4.65K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
💻 DeepMind выпустил HyperFormer — модель, которая улучшает качество на тяжёлом хвосте признаков с помощью гиперграфа

ML-специалисты подробно расписали, как работает метод, и рассказали про концепцию гиперграфа. Также в посте упомянуты sparse-фичи и даётся пример, с какой конкретно проблемой может помочь HyperFormer.

🔗 Читать разбор целиком
🔗 Ссылка на статью в оригинале
🔥4👍1
Media is too big
VIEW IN TELEGRAM
✔️ На канале 3Blue1Brown вышел новый ролик How might LLMs store facts

Это очередная часть серии видео Deep Learning. Рассказывает о том, как архитектура Transformer позволяет хранить информацию о фактах действительности.

🔗 Смотреть на YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31😍1
🛠️ Подборка материалов, чтобы изучить основные ML-фреймворки

🔹 Введение в JAX и Equinox
В статье объясняются ключевые концепции JAX, включая функциональные преобразования, такие как grad, jit и vmap.

🔹 MiniTorch
Это упрощённая версия библиотеки PyTorch, с помощью которой можно учиться создавать и обучать нейронные сети. Проект состоит из нескольких уровней сложности, начиная с простых операций и заканчивая более сложными архитектурами.

🔹 Introduction to PyTorch
А это курс от Microsoft для изучения самого PyTorch.

🔹 Intro to TensorFlow for Deep Learning
Бесплатный курс на Udacity. Нужно только зарегистрироваться.

🔹 Introduction to JAX+Flax (ноутбук)
Ноутбук также демонстрирует, как создать простую нейронную сеть.
🤩2
Даны две булевы случайные величины A и B. Мы знаем, что P(A) = 1/2, P(B) = 1/3 и P(A | не-B) = 1/4. Чему равно P(A | B)?
Anonymous Quiz
26%
1/6
15%
1/4
39%
3/4
20%
1
👍6🔥6
📌 Шпаргалка по Deep Learning

Познакомьтесь с ключевыми концепциями и алгоритмами, лежащими в основе глубокого обучения, начав с самого простого структурного блока.

📎 Шпаргалка
Please open Telegram to view this post
VIEW IN TELEGRAM
2
✍️ Реализация методов масштабирования признаков

Условие: Напишите функцию, которая выполняет масштабирование признаков, используя как стандартизацию, так и нормализацию min-max. Функция должна принимать на вход 2D массив NumPy, где каждая строка представляет образец данных, а каждый столбец — признак. Она должна возвращать два 2D массива NumPy: один, масштабированный с помощью стандартизации, а другой — с нормализацией min-max. Все результаты должны быть округлены до четырёх знаков после запятой.

Пример:

вход: data = np.array([[1, 2], [3, 4], [5, 6]])
выход: ([[-1.2247, -1.2247], [0.0, 0.0], [1.2247, 1.2247]], [[0.0, 0.0], [0.5, 0.5], [1.0, 1.0]])

Решение: смотрите на картинке выше👆
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🎉3
📖 От Кнута до Седжвика: классика алгоритмической литературы

Обзор лучших книг по алгоритмам для программистов всех уровней. От иллюстрированных пособий для начинающих до фундаментальных трудов для экспертов.

🔗 Читать подборку
🎉5👍4
cookbook.pdf
642.4 KB
✍️ Гайд по тензорам

Эта небольшая книжка из 50 страниц исчерпывающе расскажет обо всём, что связано с тензорами.

Тензор — это обобщающий термин для матриц с произвольным количеством измерений. Тензорами являются и скаляры (тензор нулевого ранга), и векторы (тензор первого ранга), и матрицы (тензор второго ранга).

🔗 Ссылка на сайт The Tensor Cookbook
10
Привет, друзья! 👋

Мы готовим статью о самых странных и уникальных дистрибутивах Linux, и нам нужно ваше мнение! 🤔💬

1️⃣ Какой самый необычный дистрибутив Linux вы когда-либо пробовали? Почему он вас удивил?

2️⃣ Есть ли у вас советы для новичков, которые только начинают работать с Linux? 🐧

Поделитесь своими идеями в комментариях! Самые интересные идеи и предложения мы обязательно включим в нашу статью. Спасибо за участие! 🙌
👍1
🤥 Наврал в резюме: 5 вариантов, что делать

Каждый из нас хотя бы раз в жизни хотел выглядеть немного лучше, чем он есть на самом деле. В этой статье хочется поговорить о том, что делать, если вы наврали в резюме, но очень хотите получить работу и теперь не знаете, как быть и что делать.
Чтобы не было казусов с ложью в резюме: забирайте наш курс для программистов:

Не хочешь преукрашивать в резюме — тогда забирай курс по Алгоритмам от базы до эксперт уровня:
🔵 Алгоритмы и структуры данных

🔗 Ссылка на статью
Please open Telegram to view this post
VIEW IN TELEGRAM
😢3👍1😁1
😎 Times составил список 100 самых влиятельных людей в AI-индустрии

Список делится на разные категории. Вот главные лица категорий:

🔹 Лидеры: Сундар Пичаи — CEO Google и Alphabet. Попал в список за стремление компании занять главенствующую позицию в ИИ-индустрии.

🔹 Инноваторы: Лиза Су — CEO AMD. Текущее поколение ИИ-чипов компании, MI300, является самым быстрорастущим её продуктом.

🔹 Мыслители: Рэй Курцвейл — американский изобретатель и футуролог. В 1990 году Курцвейл верно спрогнозировал, что ИИ победит лучшего шахматиста до наступления нового тысячелетия, и что мобильные устройства, подключенные к глобальной информационной сети, появятся в следующем десятилетии. В 1999 году он предсказал, что к 2029 году компьютеры сравняются с человеческим интеллектом во всех областях.

🔹 Созидатели: Амандип Сингх Джилл — Посланник Генерального секретаря ООН по технологиям. Координирует сотрудничество между государствами-членами организации и представителями промышленности и гражданского общества.

🔗 Посмотреть весь список можно по этой ссылке
😁7🔥6👍4🤔3