Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.9K subscribers
1.98K photos
106 videos
64 files
4.41K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/f83f07f1

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Вакансия в компанию Big3 на проект для топ-10 российского банка

Ищем Data Scientist на построение/обновление моделей и стратегий сбора задолженности
💢ЗП: от 220 тыс.

💢 Задачи: оценить имеющиеся модели оценки просроченной задолженности

💢Требуемые компетенции:
✔️Data Scientist
✔️Знание Python
✔️Опыт работы в банке в отделе collections (сбора задолженности)

💢Дата старта проекта: Февраль

💢Продолжительность проекта: 6 месяцев + продолжение на 6 месяцев

💢Результат работы:
Модели оценки просроченной задолженности
Стратегии сбора просроченной задолжености (push-уведомления, смс-сообщения, звонки, коллекторская служба)

💢Команда на проекте и бэкграунд: работа в команде клиента
💢Загрузка и ее особенности: full-time
💢Формат работы: офис/удалённо

💢Присылайте ваши резюме или рекомендации: tatiana_chinenova@glassford.global или в телеграм @tatiana_gfg
Business Data Science (2019)
Автор: Matt Taddy
Количество страниц: 352

Мэтт Тэдди, создатель учебной программы по Big Data в Школе бизнеса им. Бута Чикагского университета, сделал карьеру в обучении студентов использованию экономических принципов для связи бизнес-решений с массивными данными. Данная книга - это полезный учебник для тех, кто хочет использовать машинное обучение, чтобы влиять на направление своего бизнеса.

Скачать книгу
Что объединяет журналиста, маркетолога и разработчика игр?

Возможность улучшить свою работу, используя данные. Хотите узнать как это сделать — приходите в Нетологию на бесплатный день открытых дверей «Как начать в аналитике и Data Science». 

Вы узнаете, кому стоит учиться и работать в сфере аналитики. Поймёте, кто такие Data Scientist, продуктовый аналитик, игровой аналитик, дата-журналист, маркетолог-аналитик, инженер данных, аналитик BI, — и где они нужны. А ещё — увидите перспективы развития в аналитике, сможете выбрать направление по душе и получите пошаговый план развития карьеры → https://netolo.gy/hAS
Создание фильтра Pandoc на Python, который превращает данные CSV в форматированные таблицы.

https://proglib.io/w/bbf1c115
Митап «Основы работы с PostGIS, Hadoop и Spark»

Компания «Синимекс» приглашает принять участие в онлайн-митапе, где эксперты компании поделятся своим опытом применения современных инструментов в разработке.

В рамках митапа выступят:

- Александр Мещеряков, специалист отдела по анализу данных, с темой «PostGIS: Как обрабатывать и хранить геоданные». В ходе выступления будут рассмотрены основные функции PostGIS в теории и на практике.

- Александр Сайков, разработчик отдела по анализу данных, с темой «Hadoop и Spark». В рамках доклада будет продемонстрировано как работают самые популярные инструменты для обработки и хранения больших данных.

Когда: 2 февраля 2022 в 16:00. Подключайтесь онлайн и участвуйте в обсуждении.

Регистрация по ссылке.
🧩 5 интересных головоломок и задач, чтобы отвлечься от рутины и немного пошевелить извилинами (выпуск 15)

В нашей еженедельной подборке мы подготовили 5 новых интересных алгоритмических, логических и математических задачек для отдыха и прокачки мозгов.

https://proglib.io/sh/ak1X027h5f
☄️Друзья! 1 марта в NewProLab стартует флагманский 12-недельный онлайн-курс "Специалист по большим данным".

А это значит, вас вновь ждет самая глубокая и обьемная программа на рынке Big Data, заслужившая множество восторженных отзывов!

👉Оставляйте заявку и задавайте вопросы: https://clck.ru/XLjph 👈

Вы:
☑️Владеете основами Python?
☑️Уже умеете создавать SQL-запросы?
☑️ Знакомы с прикладными понятиями мат. анализа и линейной алгебры?
☑️Понимаете базовые операции ОС Linux?

Тогда мы приглашаем вас систематизировать текущие навыки и получить полное практическое руководство для подготовки собственных полноценных проектов.

Вы научитесь: строить модели машинного обучения, писать MapReduce-джобы, используя Hadoop Streaming и Python, работать с данными на HDFS, проводить анализ при помощи Apache Spark, строить алгоритмы рекомендательных систем.
❗️И все это на реальных дата-сетах и живых бизнес-кейсах с преподавателями и нетворком в сообществе единомышленников❗️

Эту программу уже прошли более 300 дата аналитиков и разработчиков. Присоединяйтесь и вы!
Математик (разработчик алгоритмов оптимизации)

Условия: от 250.000 + премии, удаленка.

Задачи: Разработка моделей и алгоритмов для нахождения оптимальных решений логистических, оптимизационных задач (задач оптимизации потока, задач графикования и их реализация на базе промышленных платформ, работа с данными, прототипирование и проверка гипотез. Прототипирование, моделирование предметной области, разработка алгоритмов, разработка ТЗ и спецификаций, интеграция моделей в цифровые продукты.

Требования: Опыт работы с библиотеками линейной оптимизации/машинного обучения (Gurobi, GLPK, IBM ILOG, Oracle SNO, SAP APO) - обязательное требование;
Хорошая математическая подготовка в области теории алгоритмов и теории оптимизации;
Фундаментальные знания языка Python, умение писать поддерживаемый, читаемый и тестируемый код;
Навыки написания SQL-запросов.

Подробнее: https://hh.ru/vacancy/51891212?from=employer&hhtmFrom=employer
Контакт: @zakharovaMI
Natural Language Processing with Transformers (2022)
Авторы: Lewis Tunstall, Leandro von Werra, Thomas Wolf
Количество страниц: 410

С момента своего появления в 2017 году трансформеры быстро стали доминирующей архитектурой для достижения самых современных результатов в различных задачах обработки естественного языка. Если вы специалист по данным или кодер, эта практическая книга покажет вам, как обучать и масштабировать эти большие модели с помощью Hugging Face Transformers, библиотеки глубокого обучения на основе Python.

Скачать книгу