Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
5 распространенных ошибок на собеседованиях в Google

Вопреки распространенному мнению, отсутствие знаний о структуре данных не является основной причиной отказа кандидатам. В этой статье мы прольем свет на наиболее распространенные ошибки, которые допускают соискатели на собеседованиях в Google.

🔗 Основной сайт
🔗 Зеркало
Выбор хорошего формата файла для Pandas

CSV, JSON, Parquet — какой формат данных следует использовать для данных Pandas? Автор статьи сравнивает их и дает рекомендации.

Читать статью
👍3🔥21
Спортивная аналитика с открытым исходным кодом с PySport

Если вы ищете забавные наборы данных для обучения, для преподавания, может быть, для выступления на конференции или даже если вы просто действительно увлечены ими, спорт предлагает непрерывный поток богатых данных, с которыми могут столкнуться многие люди.

Тем не менее, доступ к этим данным может быть сложным. Иногда он заблокирован в неясных форматах файлов. В других случаях данные существуют, но без четкого API для доступа к ним.

В этом подкасте говорят о PySport — удивительном списке широкого спектра библиотек (в основном Python) для доступа к широкому спектру спортивных данных из НФЛ, НБА, Ф1 и других.

Читать статью
👍4😁1
Метод Python .__call__(): создание вызываемых экземпляров

В этой статье рассказано, что такое вызываемый объект в Python и как создавать вызываемые экземпляры с помощью специального метода .call() в ваших классах. Также прилагаются несколько примеров практического использования вызываемых экземпляров в Python.

Читать статью
👍1
Не дайте себя одурачить дрейфом данных

Если вы ищете информацию о мониторинге ML в Интернете, есть большая вероятность, что вы столкнетесь с различными подходами к мониторингу, выступающими за то, чтобы поставить дрейф данных в центр решений для мониторинга.

Цель этой записи в блоге — продемонстрировать, что не все смещения данных влияют на производительность модели. Доверие к методам дрейфа падает, поскольку они, как правило, вызывают большое количество ложных срабатываний. Чтобы проиллюстрировать этот момент, автор обучает модель машинного обучения с использованием реального набора данных, отслеживает распределение функций модели в производственной среде и заставляет модель сообщать о любом отклонении данных, которое может произойти.

Читать пост
👍2
🧮 Что такое математический анализ и как он используется в программировании

Расскажем, для чего матанализ нужен в программировании, и как в нем разобраться максимально быстро без головной боли.

🔗 Основной сайт
🔗 Зеркало
👍3
😈Открываем чит-коды технического интервью на позицию в сфере Data Science.

7 июня в прямом эфире разберем основные математические задачи на собеседованиях в крупные российские и международные компании.

👉Зарегистрироваться: https://proglib.io/w/f2a10b35

Приглашенный спикер: Иван Строков – ML инженер в Yelp, запустивший отдел Data Science для pikabu.ru

🚀 На вебинаре:

1. Обсудим задачи из реальных интервью в российские и европейские компании
2. Решим задачи на матрицы и вероятности
3. Научимся быстро тестировать статистические гипотезы для А/Б тестов
4. Обсудим, какая математика лежит под капотом ML алгоритмов
5. Узнаем, что делать, если математика становится слишком сложной

👉Зарегистрироваться: https://proglib.io/w/f2a10b35
👍2
Какие знания в области математики требуются специалистам в Machine Learning и Data Science?

Валентин Рябцев, сооснователь и CPO Wale. ai, рассказал о своем карьерном пути, о том как развивать математическое мышление и как улучшать качество продукта с помощью математических методов.

Рекомендуем к просмотру – https://www.youtube.com/watch?v=KhUXzcrAk0M
👍1
👾 «Как я спас робота от жены»

Программисты — интересные люди. Они могут потратить часы своего времени чтобы реализовать сложную, но интересную вещь.

В этом видео автор использовал компьютерное зрение, нейросети и смекалку программиста, чтобы спасти робота-пылесоса от ужасной участи оказаться на свалке.

Смотреть видео
👍3
👀 Big data, дополненная реальность и компьютерное зрение

В этом видосе Data Scientist из компании Banuba поделился своим опытом с новичками и дал парочку полезных советов.

Вы узнаете про разницу Data analysis и Data Science, что такое Data mining, какие есть виды машинного обучения и поймёте всё (почти всё), что связанно с этой профессией.

Перейти к просмотру
🎡 Что такое комбинаторика и как она используется в программировании

Расскажем, какие задачи помогает решать комбинаторика и зачем программистам нужно ее знать.

Читать статью
👍3
🐍 25 алгоритмов динамического программирования, которые должен знать каждый программист

В этой статье мы рассмотрим 25 основных алгоритмов динамического программирования с реализацией на Python, которые должен знать каждый, кто увлекается спортивным программированием.

🔗 Основной сайт
🔗 Зеркало
👍3
Улучшение математических рассуждений с контролем процесса

Мы обучили модель для достижения нового уровня техники в решении математических задач, вознаграждая каждый правильный шаг рассуждений («наблюдение за процессом») вместо простого вознаграждения за правильный окончательный ответ («наблюдение за результатом»). В дополнение к повышению производительности по сравнению с надзором за результатами, надзор за процессами также имеет важное преимущество согласования: он напрямую обучает модель создавать цепочку мыслей, которую одобряют люди…

Читать дальше
👍3