Вакансии в IT | ИТ

#вакансия #удаленка #remote #fulltime #senior #dataengineer #python #spark

Компания Centicore💙 находится в поисках Data Engineer. Наша компания занимается продуктовой разработкой проектов наших Заказчиков под ключ.

Вакансия: Data Engineer (Python/Spark/Airflow)
Формат работы: Удаленно по РФ
Вилка: 300-340к на руки (в зависимости от опыта и пожеланий кандидата)
Технический уровень: Middle+

🔷 Важно для нас:

- Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas;
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников;
- Способность разобраться с API поставщиков данных, используя доступную документацию;
- SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum;
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow;
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark

🔷 Задачи:

- Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка;
- Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения;
- Создание и развитие ETL/ELT-проектов на стеке Python + PySpark + Airflow;
- Разработка и поддержание в актуальном состоянии технической документации по разработанному функционалу;
- Своевременное отражение статуса выполнения задач в Jira;
- Проверка качества кода (code review), написанного инженерами и младшими инженерами данных;
- Участие в развитии Feature Store и улучшении процессов работы с признаками для ML-моделей.

💌 Для вопросов и резюме - просьба обращаться в лс @ktvsk_d

224 views09:38

Вакансии в IT | ИТ

#вакансия #dataengineer #llm #healthtech #фултайм #москва

Вакансия: Data Engineer
Компания: AI HealthTech стартап
Формат: гибридный (предпочтительно) / удаленный по РФ
Оформление: ГПХ (после ИС возможен переход на ТК)
Локация: Москва-Сити
Занятость: full-time
Вилка: 300 - 350к ₽ Гросс

AI Healthcare стартап создает продукт, который трансформирует привычные процессы в здравоохранении, делая их эффективнее и меняя мир к лучшему 🕊

Сейчас команда в поиске Data Engineer, который будет заниматься построением и оптимизацией ETL-пайплайнов для обработки миллионов строк медицинских данных.
Вам предстоит обеспечивать качество и целостность данных, вы будете работать на стыке клиник, поставщиков данных и ML-команды, обеспечивая стандарты для обучения моделей.

🔸 Основные задачи:
· Анализ, нормализация и очистка крупных медицинских датасетов (EHR, анализы, диагнозы).
· Разработка и адаптация ETL-пайплайнов под разные источники данных.
· Контроль качества входящих данных, коммуникация с поставщиками и стейкхолдерами.
· Тесная работа с ML-инженерами над форматами данных и улучшением пайплайнов.

🔸 Что ожидаем:
· Опыт работы с Python (Pandas, NumPy, PyTorch; PySpark / Dask - плюс).
· Понимание описательной и инференциальной статистики.
· Готовность к предобработке данных на основе LLM.
· Опыт работы с большими языковыми LLM моделями.
· Практика работы с данными масштаба миллионов записей.
· Умение ясно доносить идеи как технической, так и нетехнической аудитории.
· Готовность погружаться в медицинскую специфику.

🔸 Будет плюсом:
· Опыт в биоинформатике / медицине / HealthTech.
· Понимание конфиденциальности данных (GDPR / HIPAA).
· Знание медицинских систем кодирования (ICD-10, LOINC).
· Опыт с ETL-оркестрацией (Airflow), FHIR / HL7.

🔸 Условия:
· В компании действительно мощная команда талантливых специалистов, в которой есть несколько PhD, они драйвят процессы и привносят по своему уникальные решения в реализацию продукта.
· Возможность применить опыт и развить экспертизу в проекте, который реально помогает людям.
· Высокая степень ответственности и влияния на архитектуру данных и конечный продукт.
· Работа со сложными задачами и современным стеком технологий.
· Оплата в рублях или USDT.

Направляйте ваши отклики с резюме - @Inga_IT 📩

❤1

565 views09:22

Вакансии в IT | ИТ

#hiring #dataengineer #BI #seniordataengineer #edtech #datalake

🔥 Senior Data Engineer
Тип занятости: full-time
Компания: школьный EdTech-продукт
Уровень: Senior
ЗП: готовы обсуждать в зависимости от опыта
Локация: РФ / удаленно без ограничений
Мы ищем сильного Data Engineer, который возьмет на себя ключевую роль в развитии аналитической платформы и BI-направления внутри компании.
Это позиция с высоким уровнем влияния на то, как устроена работа с данными: от взаимодействия с бизнесом до построения устойчивой data-инфраструктуры.
Команда развивает аналитическую платформу в EdTech-продукте, где данные напрямую используются для продуктовых решений и отчетности.

Что предстоит делать:
— развивать и поддерживать data-платформу (DWH + Data Lake);
— выстраивать и оптимизировать ETL/ELT-процессы и data pipelines;
— работать с большими объёмами данных для аналитики;
— трансформировать бизнес-запросы в технические решения;
— проектировать слои данных: staging, ODS, факты, измерения;
— улучшать качество данных (consistency, completeness, accuracy), внедрять мониторинг data quality и процессов;
— участвовать в развитии BI-слоя и витрин данных для отчетности;
— выступать связующим звеном между бизнесом и технической командой.
Что важно:
— опыт работы с данными от 4–6 лет;
— уверенный SQL и опыт оптимизации запросов;
— опыт работы с PostgreSQL и ClickHouse;
— Python для анализа данных и автоматизации ETL;
— опыт с Data Lake / Lakehouse или стеком Spark / Hive / Hadoop / Databricks;
— знание Airflow, dbt;
— понимание архитектуры DWH и жизненного цикла данных;
— уверенный опыт работы с BI-инструментами (Power BI / Tableau / DataLens);
— опыт взаимодействия с бизнес-заказчиками и участия в проработке требований;
— участие в проектировании архитектуры аналитических платформ

CV 📩 Контакт: @hello_techrecruiter

681 views12:11

About

Blog

Apps

Platform