Data Science Jobs
16.3K subscribers
47 photos
3 videos
1 file
657 links
Номер регистрации: 4776865361

Лучшие вакансии по темам Data Science, машинного обучения, нейросетей, искусственного интеллекта, компьютерного зрения, сбора, обработки и анализа данных.

По всем вопросам: @musit
Чат: @bigdata_ru
Download Telegram
#DataScience #Startup #удаленно #python #NLP #sklearn #pytorch #Tensorflow

Ищу Data Scientist NLP в стартап

Локация: не важно, но офис в Москве. Можно удаленно по всей РФ.

Зарплата: Если фулл-тайм, зарплата 5 тыс. $, если парт тайм — по договоренности. Работать можно удаленно из любой точки РФ. Зарплата белая, трудоустройство официальное, финансирование стабильное.

О продукте: SEO платформа. Мы создаем систему сбора поисковой аналитики для продвижения бизнесов. В России только 2-3 конкурента. Проект планируется развивать на западном рынке.

Первые задачи:
- определение автогенерированного текста / генерация , для всех базовых языков
- определение качества текста и его соответствия теме
- ранжирование, по типу поискового

Чем нужно будет заниматься глобально?
- «получением» данных из различных исходников;
предобработкой данных (в первую очередь, текстов на русском языке);
- проведением анализа данных (выявлением трендов, тенденций, созданием прогнозов и пр.) по направлениям деятельности департамента;
- анализом текстов: анализ тональности, классификация текстов, тематический анализ;
- удаление из текстов информации заданного характера;
- анализ информативности и корректности текстов; возможно, аннотирование;
- разработкой и оптимизацией моделей с применением инструментов и методов машинного обучения;
- тестированием и доработкой моделей машинного обучения;
- визуализацией данных с помощью Python, BI-инструментов или иных технических решений;
- формированием описательной документации по разработанным моделям совместно с бизнес-аналитиком.

Что важно по опыту:
- владение Python ;
- понимание основных алгоритмов машинного обучения;
- уверенное знание основ теории вероятностей и математической статистики;
- опыт работы с классическим ML-стеком (scikit-learn, pandas, numpy, scipy) и Deep Learning фреймворками (pytorch/tensorflow);
- хорошее знание базовых алгоритмов и структур данных.
- опыт обучения и внедрения современных NLP-моделей (BERT/RoBERTa/GPT/ (LSTM, Transformers, GPT-2, word2vec, glove, fasttext, tf-idf));
- опыт самостоятельной реализации алгоритмов машинного обучения;
- знакомство с алгоритмами обработки больших данных и парадигмой MapReduce;
- акцент на работу с en/eu языками
- опыт работы обязательный в крупном проекте
- знание английского на техническом уровне.

Пишите, пожалуйста, в тг @annavetrova20 ваши финансовые ожидания, и резюме. Готовы обсуждать разные варианты.
#Вакансия #DataScientist #AutoML #CUDA #Python #R #pandas #numpy #sklearn #matplotlib #seaborn #xgboost

Data Scientist

Neuton.ai (https://neuton.ai) – это уникальная AUTO ML платформа, созданная на базе собственного запатентованного нейронного фреймворка. Это облачное SAAS решение, которое делает доступным машинное обучение даже для пользователей без навыков data science и программирования.

Что у нас по стеку:
Ядро - C/C++, CUDA
Обработка данных: Python, numpy, pandas, sklearn, nltk, xgboost, catboost, lightgbm, tensorflow, torch
Платформа: Java, Spring Boot, Spring Data, JPA/Hibernate, RabbitMQ, Vue.js (front)
Инфраструктура: Git, Jenkins, Ansible, Terraform, GCP, GKE(kubernetes), Docker, Keycloak, Grafana, Openstack
Этот короткий ролик демонстрирует, то, с какой легкостью теперь может быть решена, например задача прогнозирования оттока клиентов https://www.youtube.com/watch?v=yKHvzBS1MCU

Мы представили наш продукт меньше года назад, но уже сегодня сотни компаний в США пользуются нашим решением. Невероятный спрос на AUTO ML продукты, заставляет нас двигаться еще быстрее.

Expectations

Responsibilities:
• Engage in work on automating data preprocessing & feature engineering methods,
• Learn new approaches
• Conduct experiments, write a lot of code.

Hard skills:

• 3 years in an applied data science role
• Fluency with scripting (Python or R)
• Hands-on experience with pandas, numpy, sklearn, matplotlib, seaborn, xgboost or R corresponding packages
• Ability to independently perform complete machine learning projects including data cleaning/processing, EDA, hypothesis generation/testing, feature engineering, algorithm selection/tuning/validation, and generation of experiment reports
• Knowledge of metrics definitions and differences, and metrics optimization techniques
• Understanding of Logistic/Linear regression, Decision Trees/Random Forest/Boosted Trees/ neural networks frameworks
• Ability to explain strong and weak points of the above algorithms’ applications
• Strong knowledge of Statistics
Soft skills:
• Exceptional verbal communication, writing and interpersonal skills

Good to have:

• Familiarity with BigData, Hadoop, CUDA
• Fluent in English

We offer:

• Competitive compensation & benefits package
• Work with newest algorithms, NN frameworks
• Development of AutoML platform
• Participation in the TOP DS community events

Contacts:

@work20202020
#вакансия #ds

Мы в Циан 🏘 ищем сильного Senior Data Scientist-а в команду CRM.

Локация - Полная удаленка внутри РФ. Если есть желание ходить в офис, у нас есть замечательные современные офисы в Москве, Питере и Новосибе.

Вилка - от 350 до 500 гросс, готовы обсуждать

О нас
В Циан большая команда ML. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу!

Команда CRM занимается прямыми коммуникациями с клиентами (пуши, емейлы, смски и тд)

Наш стек
● Python (Numpy, SciPy, Pandas, sklearn, PyTorch);
● Экосистема Hadoop (PySpark, Hive, Kafka);
● Airflow;

Задачи:
● Повышение эффективности пуш-уведомлений, емейлов и других каналов прямых коммуникаций с клиентами;
● Оптимизация коммуникационной нагрузки, выбор оптимального канала коммуникации, выбор оптимального времени отправки;

Требования к кандидату
● Опыт: Не менее 3х лет релевантного опыта на позиции DS в продуктовой компании
● Python: пишет легко читаемый и поддерживаемый код
● SQL (оконные функции, оптимизация запросов)
● Apache стек: HDFS/Kafka/Spark (DF API)
● Классический ML: бустинги, линейные модели.
● Базовые знания в NLP и CV: трансформеры, TF-IDF
● DL: PyTorch.

Плюшки:
ДМС с первого дня (стоматология, госпитализация, полис ВЗР), Кафетерий льгот Benefactory, 5 day off в год, помимо основного отпуска.

Пишите в ЛС рекрутеру / мне (@DANAlina95 / @kgavrilchik) или скидывайте свои резюме на a.dmitrenko@cian.ru


#Python #Numpy #SciPy #Pandas #sklearn #PyTorch #Hadoop #PySpark #Hive #Kafka #Airflow