Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.24K photos
111 videos
64 files
4.65K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
👾 Небольшая игра для понимания концепции активного обучения

Этот сайт содержит описание такого подхода, как активное обучение. Его суть заключается во взаимодействии алгоритма с некоторым источником информации, способным размечать запрошенные данные.

В игре вам предлагается разметить точки на графике так, чтобы построенная разделяющая линия совпала с истинной границей принятия решения.

🔗 Ссылка на игру
🎉3
👀 ML system design: 450 примеров для изучения

Это большая таблица, которая содержит материалы с описанием систем машинного обучения более 100 компаний: от Netflix до Slack. Вы можете искать по базе, фильтруя примеры по отраслям или направлению машинного обучения.

Вот лишь некоторые примеры из базы:

▪️GitLab: проверка качества сгенерированного ИИ материала;
▪️Netflix: классификация видеоконтента;
▪️Google: исправление грамматических ошибок

🔗 Ссылка на полную базу
🔥10
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
🐱 Pipecat — open-source фреймворк для создания голосовых и мультимодальных агентов

Позволяет разработчикам создавать такие приложения, как персональные помощники, боты для работы с клиентами и пр.

Фреймворк поддерживает интеграцию с различными AI-сервисами, предлагает возможности для работы с текстом, изображениями и видео и обеспечивает гибкость для локального или облачного развёртывания.

🔗 Ссылка на репозиторий
1
🔢 Калькулятор для расчёта необходимого размера выборки для A/B тестов

Реддитор поделился сайтом, который сделал, чтобы облегчить себе жизнь.

Калькулятор может:
▪️работать с разными пропорциями распределения групп (например, 20/80),
▪️поддерживать более двух тестируемых групп помимо,
▪️выбирать между односторонним и двусторонним статистическим тестом.

🔗 Ссылка на калькулятор
7👍3
Хардкорный курс по математике для тех, кто правда любит математику!

Начать с вводных занятий можно здесь, ответив всего на 4 вопроса – https://proglib.io/w/584771bd

Что вас ждет:

– Вводный урок от CPO курса;

– Лекции с преподавателями ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск;

– Практические задания для закрепления материала и ссылки на дополнительные материалы.

⚡️ Переходите и начинайте учиться уже сегодня – https://proglib.io/w/584771bd
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🧡💛 Теперь создавать и редактировать Google Sheets можно прямо из Colab-ноутбука

Новая функция InteractiveSheet предоставляет графический интерфейс (GUI) для данных. Вы можете анализировать их и трансформировать так, как делали бы это в Google Sheets. Нужно лишь ввести строчку:

👉 sh = sheets.InteractiveSheet(df=df, title='your_title')
🔥9👍42🥰1😁1
15 Pictures with Deep Meaning:

1. 👆

Итак, коллеги, делимся любимыми картинками про DS и ML, чтобы собрать пак из минимум 15 мемов 👇
😁9👍2
🐍🛠️ 5 Python-инструментов, которые изменят ваш подход к разработке

Эффективность разработки на Python во многом зависит от используемых инструментов. В этой статье мы рассмотрим пять мощных решений, способных существенно повысить продуктивность вашей работы.

👉 Читать статью
🥰3
This media is not supported in your browser
VIEW IN TELEGRAM
✍️ Многослойный перцептрон в PyTorch

Автор блога AI by Hand предложил следующее упражнение: 

Вам дан шаблон кода слева и схематичное изображение многослойного перцептрона справа (см. видео, прикреплённое к посту). Нужно заполнить пробелы.

Вот шаги для заполнения👇

▪️Первый линейный слой:
Размер входных признаков — 3. Размер выходных признаков — 4. Мы видим, что размер матрицы весов составляет 4 на 3. Также есть дополнительный столбец для смещений (bias = T).

▪️Функция активации — ReLU. Мы видим эффект ReLU на первом признаке (-1 -> 0).

▪️Второй линейный слой:
Размер входных признаков — 4, что совпадает с размером выходных признаков предыдущего слоя. Размер выходных признаков — 2. Мы видим, что размер матрицы весов составляет 2 на 4. Но нет дополнительного столбца для смещений (bias = F).

▪️Функция активации — ReLU.

▪️Финальный линейный слой:
Размер входных признаков — 2, что совпадает с размером выходных признаков предыдущего слоя. Размер выходных признаков — 5. Мы видим, что размер матрицы весов составляет 5 на 2. Также есть дополнительный столбец для смещений (bias = T).

▪️Функция активации — Sigmoid. Мы видим эффект Sigmoid, который представляет собой нелинейное отображение «сырых» значений (3, 0, -2, 5, -5) к вероятностным значениям (между 0 и 1).
🥰6👍3
✍️ Слияние словарей в PyTorch: зачем нужно и подводные камни

Обучение большой сети на одной видеокарте может стать проблемной задачей. Одним из способов решить её является разбивка датасета на части и обучение одной и той же нейросети параллельно на разных устройствах. Однако затем нужно каким-то образом слить обученные нейросети в одну.

👉 О том, как это делать, можно подробнее почитать в новой статье на «Хабре»
🔥2🥰2
🪐 Satyrn — удобная альтернатива JupyterLab для macOS

▪️Инструмент бесплатный. Нужно просто скачать подходящий клиент с сайта.
▪️Запускается в отдельном окне без каких-либо дополнительных окон терминала.
▪️К работе с Jupyter Notebooks можно приступить сразу.
▪️Можно установить любое ядро, с которым вы привыкли работать.

🔗 Ссылка на сайт Satyrn
👍6
Внимание, задание:

С помощью эмодзи расскажите, чем вы занимаетесь на работе 👀

Вот пример: 🧑‍💻😭🧑‍💻

👇Ждём в комментариях👇
🔥6