Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Анимированный Трансформер

Трансформеры лежат в основе последних достижений в области больших языковых моделей. В этой статье автор объясняет некоторые из его внутренних механизмов и даёт общее представление о том, как эти модели функционируют.

Читать статью
👍51
Нейросеть в 11 строчек на Python

В этом пособии автор учит алгоритму обратного распространения ошибок на примере небольшой нейронной сети, реализованной на Python.

Смотреть статью
👍4🤯1
Сколько курсов вы купили и не стали проходить?
Расскажите в комментариях ⬇️
#интерактив
😁62👍1
Что с CPython, Pypy, MicroPython, Jython…?

Эта всеобъемлющая статья знакомит вас со всеми различными способами, которыми вы можете использовать Python. CPython — не единственный выбор, узнайте, что еще есть и почему вы можете выбрать альтернативу.

Читать статью
👍21
Как работает ROC-кривая?

ROC-кривая — это графическое изображение контраста между показателями истинно положительных и ложноположительных результатов при различных пороговых значениях.

Если считать TPR и FPR для фиксированного порога μ є [0,1], то их можно представить в виде функций от аргумента μ:

TPR = TPR(μ), FPR = FPR(μ). При этом обе функции монотонно возрастают от 0 до 1, а значит, определена функция:

ROC(x) = TPR(FPR-1(x)), x є [0,1]

ROC-кривая — это график функции. Как правило, у хорошего классификатора кривая лежит по большей части либо целиком выше прямой y=x. Это связано с тем что при хорошей классификации надо получать максимальный TPR при минимальном FPR.
#вопросы_с_собеседований
👍121
cv3 — делаем OpenCV питоничным

cv3 — это обёртка над opencv-python, которая ускоряет написание кода, не сужая функциональность. Автор статьи сам является создателем кода.

Смотреть статью
👍3
AMD — вечная канарейка Intel

Если прямо сейчас посмотреть на рынок процессоров, то может сложиться обманчивое впечатление, что AMD на равных конкурирует за место под солнцем с компанией Intel. Кто-то может посчитать, что так было всегда. Реальность же заключается в том, что если Intel всю свою историю колебалась между полной гегемонией и просто доминированием на рынке процессоров для персональных компьютеров и серверов, то AMD в хорошие моменты своей истории была строго второй, а в плохие — находилась буквально при смерти.

Читать статью
Какие сериалы/фильмы о программировании мотивируют вас продолжать обучение?
#интерактив
🐍 Комментарий особого типа: выполнение скриптов Python с помощью Shebang

Вы узнаете, что такое шебанг, когда включать его в скрипты Python, научитесь определять шебанг в разных системах, а также выполните скрипты через собственный интерпретатор, написанный на Python.

🔗 Основной сайт
🔗 Зеркало
👍2
Числа с плавающей точкой для гуманитариев. Что это такое и как они работают

На данную тему уже написано большое количество статей, однако многие из них используют пугающие математические формулы и нотации, что может быть сложно для понимания новичкам. В этой статье автор простым языком попытался раскрыть данную тему и помочь решить ряд вопросов.

Читать статью
👍31
Алгоритмы компрессии данных: принципы и эффективность

В современном информационном обществе объем данных стремительно растет, и с каждым годом все больше информации генерируется и обрабатывается. В связи с этим важным аспектом стало умение эффективно управлять данными, чтобы не только сохранить информацию, но и оптимизировать ее использование и передачу. Одним из основных инструментов для достижения этой цели является компрессия данных.

Читать статью
3
Нейронные сети

Небольшие ролики на тему того, как работают нейросети, что такое нейроные смещения, параметры, функции активации и как математика превращает изображения в скетчи.

1. Пытаюсь познакомиться
2. Рисунок из фотографии
3. Функция активации
4. Нейрон смещения
5. Простые эксперименты

Перейти к плейлисту
🔍 10 вопросов дата-сайентисту

Короткое интервью с дата-сайентистом Научно-Технического центра «Газпром нефти». В нём он делится всем, что знает про data science, big data, нейронные сети и даже немного затрагивает тему работы в «Газпроме».

Смотреть видео
Внимание — это все, что вам нужно

Это статья из Google Brain и Google Research, в которой изначально была предложена идея замены RNN-сетей в обработке естественного языка. В статье автор объяснил теоретическое устройство трансформера, а затем реализовал его в PyTorch.

Читать статью
👍2😁1
❗️Целых два новых канала!

Хорошая новость для джавистов: мы запустили два канала, чтобы вам было еще проще практиковаться и готовиться к офферу мечты 💪

👉Библиотека Java для собеса — канал, в котором мы будем выкладывать наши уже традиционные вопросы с собеседований (и, конечно же, ответы на них)

👉Библиотека задач по Java — канал с задачами, тестами, квизами и, конечно, кодом

Бегом подписываться 🏃
1🔥1
Пользуетесь ли вы какими-либо иностранными новостными ресурсами по программированию на регулярной основе? Если да, то какими?
#интерактив
👍1
Важно: правила площадки❗️

1️⃣ За спам, рекламу, ботоводство, скам — бан и удаление всех комментариев

2️⃣ За оскорбления группы/канала/админа/других участников, политические дебаты — первый раз удаление, второй раз — профилактический бан на неделю, третий раз — бан

3️⃣ За ссылки на нелегальные ресурсы — первый раз удаление, второй раз — бан

Напоминаем, что написать нам можно сюда: @proglibrary_feedback_bot

Пожалуйста, соблюдайте правила — мы со своей стороны тоже будем стараться максимально оперативно модерировать комментарии.
👍81👏1🤯1