Data Science Work
3K subscribers
21 photos
245 links
Вакансии и мероприятия в сфере Data Science и Machine Learning, чтобы опубликовать пишите @irinochka_ch.
Наши сообщества: @datasciencechat, @datasciencelinks, vk.com/datascience, vk.com/tensorflow
Download Telegram
#вакансия

Вакансия: Data DevOps/Data Engineer в компанию Mimesis, Inc
Специализация: #devops #data_engineer
Локация: Армения, Ереван (релокейт)
Уровень: senior (3 года+)
Вилка: 3000-4500$
Английский: B1

Мы компания выходцы из Беларуси Mimesis, Inc, уже как 4 года занимаемся разработкой в области Data Science. Одна из наших разработок отлично подходит для интеграции в мобильные B2C приложения, поэтому в последний год активно двигаемся в сторону мобильной разработки. Наша цель показывать людям по их фотографии, как будет выглядеть их тело в будущем (бицепсы, грудь, торс и т. д.).

Задачи:
У большинства членов команды есть задачи, которые выходят за рамки специализации и нам нужен человек, который поможет с решением этих задач.

В частности:
• Докеризация текущего решения и подготовка к развёртыванию в autoscaling в AWS
• Развёртывание инфраструктуры на базе AWS: В базовой комплектации сейчас (набор EC2 инстансов); в полноценной комплектации в ближайшем будущем (EKS, autoscaling, load balancing, Jenkins, GitOps etc.)
• Разработка в базовом виде и поддержка бэкенда для лендинг сайтов.
• Обновление медиаресурсов на сайте (изображения, видео и тд)
• Скраппинг изображений с открытых источников: веб-сайты, поисковики (chrome), видеозаписи (планируется), соц-сети

Автоматизация экспериментов:
• Разработка скриптов, позволяющих автоматизировать препроцессинг/постпроцессинг данных для проверки ML гипотез
• Проведение батч обработки датасетов (например, нормализация цвета)

Помощь в расширении покрытия пользователей:
• Разработка и подготовка ботов для соцсетей: Twitter, Telegram, Facebook(в будущем) + бот для работы с нейросетями

Оптимизация процессов работы:
• Автоматизация доставки и развёртывания кода для ML (GitOps/Jenkins)
• Автоскейлинг сервисов (AWS-based)
• Внедрение практик качества кода (SonarQube-like)
• Оптимизация использования хранилища (warm/cold s3 etc)
• Мониторинг доступности сервисов
• Greeb-Blue/Canary практики развёртывания

Контакт: @Anti1One
👍6
#вакансия #DevOps #MLops #удаленка #НЛМК

Вакансия: MLOps Engineer
Компания: ГК НЛМК
Локация: Москва, офис/удаленка (как удобно)
Занятость: full time
ЗП: от 200 до 400т.р. (Обсуждаемо)+ годовой бонус
Контакты: @Siverin_ia (Игорь)
siverin_ia@nlmk.com

Группа НЛМК — крупнейший в России и один из самых эффективных в мире производителей стальной продукции. Производственные активы в России, Европе, Азии и США.
Мы создаем совершенную сталь для ключевых отраслей: от строительства до ветроэнергетики. Разрабатываем новые технологии и внедряем передовые цифровые решения.
MOps engineer будет заниматься разработкой и эксплуатацией DSML (Data Sciene and Machine Learning) платформы. Наша DSML платформа не просто позволяет создавать и эксплуатировать модели, она позволяет превращать инсайты и экспертизу Data Scientist-а в работающий код, легко передавать ее между Data Scientist-ами и сохранять в компании.

Основные задачи:
•Развертывание, разработка и эксплуатация сервисов и инструментов DSML (Data Science & ML) платформы:
•K8s кластеры для интерактивной разработки на базе Jupyter Lab (кластер общего назначения и Computer Vision)
•K8s кластеры для распределенных вычислений на базе Spark
•K8s кластеры для запуска ML pipelines по расписания
•Python библиотек и других инструментов для ML-пайплайнов, включая инструменты для DAG (типа Dagster, Argo)
•Распределенное хранилище для данных: HDFS, S3 + Kafka
•Computer Vision инфраструктура, Сервера с A100, DeepStream, разнообразное оборудование для inference на производстве
•Инфраструктура Model Serving, CI/CD пайплайны для моделей
•Развитие сloud-native архитектуры на базе private и hybrid cloud
•Обеспечение воспроизводимости и возможности обмениваться (легкой передваемости) кода, данных и результатов экспериментов
•Интеграция платформы в корпоративную инфраструктуру (GitLab, Jira, Confluence, Artifactory, Active Directory), с учетом практик безопасности.
•Настройка производительности инфраструктуры, в том числе Apache Spark. Профилирование кода и элементов инфраструктуры
•Поддержка пользователей DSML платформы


Требования:
•Опыт администрирования linux, работающих сервисов на базе Open Source
•Опыт настройки, отладки и мониторинга систем, начиная с уровня hardware, продолжая уровнем сети, виртуализации, оркестрации и заканчивая конечными сервисами
•Опыт совместной разработки software, опыт работы в команде по SCRUM Kanban методологиям
•Знание языков python, bash, плюсом будет опыт С/С++ и других языков,
•Готовность, разрабатывая код, отвечать за его эксплуатацию в продуктовой среде
•Готовность, как инженер и разработчик, отстаивать интересы Data Scientist-ов
•Желание (можно даже страстное) работать в области Data Science
•Понимать принципы контейнеризации (K8s или Docker Swarm), знание docker
•Быть сторонником принципов DevOps/SRE, Cloud Native архитектуры
•Уметь сочетать гибкие принципы Agile, с дисциплиной для обеспечения SLA
•Уметь следовать и культивировать в компании стандарты вокруг разработки, готовность документировать результаты своего труда
•Понимание процессов CI/CD. Плюсом будет опыт настройки CI на базе Gitlab;
•Опыт настройки сетевых сервисов, nginx или других балансировщиков
👍4🔥2🌭1