Инструмент обеспечения качества данных: от теории к практике
#dataquality #dataengineering
https://habr.com/ru/companies/leroy_merlin/articles/857044/
#dataquality #dataengineering
https://habr.com/ru/companies/leroy_merlin/articles/857044/
Хабр
Инструмент обеспечения качества данных: от теории к практике
Всем привет! Меня зовут Саша Ткачев, я ведущий дата-инженер отдела управления ценностью данных в Лемана ПРО (Леруа Мерлен ) . Наша команда занимается разработкой self-service инструментов для...
Как мы попробовали Apache Iceberg в связке со Spark и что из этого вышло
#iceberg #apache #apachespark #spark #dataengineering
https://habr.com/ru/companies/cian/articles/859484/
#iceberg #apache #apachespark #spark #dataengineering
https://habr.com/ru/companies/cian/articles/859484/
Введение в синтетические данные для ML: зачем они нужны?
#datascience #generativemodels #datascientist #dataengineering
https://habr.com/ru/companies/data_light/articles/860310/
#datascience #generativemodels #datascientist #dataengineering
https://habr.com/ru/companies/data_light/articles/860310/
Хабр
Введение в синтетические данные для ML: зачем они нужны?
Генерация документов, лиц и даже симуляция целых атак: как далеко можно зайти в создании и использовании синтетических данных? В этой статье Артур Казукевич, Data Science Engineer в Data Light,...
Будь T-shape
#dataengineering #dataengineer #tshape #ishape #развитиевit #карьеравit #чтоучить
https://habr.com/ru/articles/859850/
#dataengineering #dataengineer #tshape #ishape #развитиевit #карьеравit #чтоучить
https://habr.com/ru/articles/859850/
Хабр
Будь T-shape
Вступление Сегодня поговорим о T-shape — концепции, которая играет огромную роль для дата-инженеров и профессионалов в работе с данными. Почему важно быть не только специалистом в своей области, но и...
Гайд по установке Apache Airflow, на случай, если у тебя его ещё нет в преддверии 2025 года
#apacheairflow #dataanalytics #датааналитик #dataengineering #etl
https://habr.com/ru/articles/860900/
#apacheairflow #dataanalytics #датааналитик #dataengineering #etl
https://habr.com/ru/articles/860900/
Хабр
Гайд по установке Apache Airflow, на случай, если у тебя его ещё нет в преддверии 2025 года
Немного лирики, что такое Apache Airflow — это оркестратор (ваших данных), инструмент для создания, планирования и мониторинга рабочих процессов (так называемых DAGs — Directed Acyclic Graphs). Что с...
Михаил Водолагин, ex-CDO Deeplay: «Люди умудряются выстрелить себе в ногу очень по-разному!»
#интервью #аналитика #dataengineering #datascience #machinelearning #datavisualization #собеседования
https://habr.com/ru/articles/860322/
#интервью #аналитика #dataengineering #datascience #machinelearning #datavisualization #собеседования
https://habr.com/ru/articles/860322/
Хабр
Михаил Водолагин, ex-CDO Deeplay: «Люди умудряются выстрелить себе в ногу очень по-разному!»
Что, на ваш взгляд, самое странное может сделать кандидат на собеседовании? Вы когда-нибудь задавали себе вопрос, в чём главное отличие дата инженераот «обычного» аналитика? Знаете, в чём...
Документация, которая точно не навредит аналитике в Вашем проекте
#документацияэтолегко #аналитикаданных #dataanalysis #dataengineering #метаданные
https://habr.com/ru/articles/864512/
#документацияэтолегко #аналитикаданных #dataanalysis #dataengineering #метаданные
https://habr.com/ru/articles/864512/
Хабр
Документация, которая точно не навредит аналитике в Вашем проекте
Привет! Я работаю Chief Data Officer в средней российской компании и, думаю, попробовал «всякое» в плане работы с документацией для команды, которая работает с данными. Хочу...
Инфраструктура для Data-Engineer виртуальные окружения
#виртуальныеокружения #dataengineering #dataengineer #разработканаpython #pythonразработка #работасвиртуальнымиокружениями #poetry
https://habr.com/ru/articles/861412/
#виртуальныеокружения #dataengineering #dataengineer #разработканаpython #pythonразработка #работасвиртуальнымиокружениями #poetry
https://habr.com/ru/articles/861412/
Хабр
Инфраструктура для Data-Engineer виртуальные окружения
Введение В современной Python-разработке управление зависимостями и изоляция проектов являются критически важными аспектами. Независимо от того, работаете ли вы над небольшим скриптом или крупным...
NVidia Triton Inference Server: строим production ML без разработчиков
#selectel #itкомпании #itинфраструктура #облачныесервисы #dataengineering #inference #платформы
https://habr.com/ru/companies/selectel/articles/866256/
#selectel #itкомпании #itинфраструктура #облачныесервисы #dataengineering #inference #платформы
https://habr.com/ru/companies/selectel/articles/866256/
Хабр
Nvidia Triton Inference Server: строим production ML без разработчиков
Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel. В этой статье расскажу про наш новый продукт — Inference-платформу Selectel , а также вызовы, с которыми мы...
Рынок дата-инженеров и прогноз на 2025
#dataengineering #dataengineer #стоитлистановитьсяdataengineer #датаинженер #наймвит #наймдатаинженеров #рынокдлядатаинженеров
https://habr.com/ru/articles/864780/
#dataengineering #dataengineer #стоитлистановитьсяdataengineer #датаинженер #наймвит #наймдатаинженеров #рынокдлядатаинженеров
https://habr.com/ru/articles/864780/
Хабр
Рынок дата-инженеров и прогноз на 2025
Резюме видео Рынок дата-инженеров В своих видео и статьях я ни раз говорил о важности данных, не только потому что я работаю дата-инженером, но и также потому что все привыкли работать с данными....