Статья Netflix о Data Mesh - управление конвейером потоковой передачи данных.
#netflix #datamesh #dataops
@devopskaz
#netflix #datamesh #dataops
@devopskaz
Medium
Data Mesh — A Data Movement and Processing Platform @ Netflix
By Bo Lei, Guilherme Pires, James Shao, Kasturi Chatterjee, Sujay Jain, Vlad Sydorenko
👍2🔥1🥰1👏1
Данных становится все больше и растут они с огромной скоростью. Их нужно хранить, обрабатывать и работать с ними. Тут и приходит на помощь инженерное мышление — оптимизация с подходом DataOps.
Лучшие практики DevOps подключаются к управлению данными. На чем они фокусируются?
➖ Воспроизводимая работа с данными
Иначе говоря, а давайте не будем заново обрабатывать данные. Пайплайны должны выстраиваться вокруг внутрикомандных процессов доставки, подготовки, деплоя. При правильном построении пайплайна любая команда в любой момент может получить требуемые данные.
🚩 Census — это платформа для операционной аналитики с обратным ETL (извлечение, преобразование, загрузка) и единое надежное пространство для переноса данных из хранилища в ваши повседневные приложения.
➖ Аналитика как код
Аналитику можно рассматривать как код и конфигурацию, которые описывают действия с данными для получения обработанной информации. Так работа с данными будет воспроизводима, ее можно интегрировать в конвейер и быть более гибкими, когда изменяем инфраструктуру.
Надежный воспроизводимый пайплайн для обработки и получения данных позволяет представить аналитику в виде кода.
🚩 dbt позволяет развертывать аналитический код в короткие сроки с помощью модульности, переносимости, CI/CD и документации.
➖ Данные как платформа
Мало получить информацию, ее еще надо обработать. Эти решения должны быть легко масштабируемыми, ведь представление данных в качестве платформы — это главная задача DataOps-инженера. Такая методология позволяет разработчикам запускать свои среды для быстрого прототипирования, получать данные здесь и сейчас и на их основе уже создавать продукты.
🚩 Databricks Lakehouse — это комплексная платформа управления данными, которая объединяет сценарии использования хранилища данных и ИИ через веб-интерфейс, интерфейс командной строки и SDK.
#devops #dataops
@DevOpsKaz
Лучшие практики DevOps подключаются к управлению данными. На чем они фокусируются?
Иначе говоря, а давайте не будем заново обрабатывать данные. Пайплайны должны выстраиваться вокруг внутрикомандных процессов доставки, подготовки, деплоя. При правильном построении пайплайна любая команда в любой момент может получить требуемые данные.
🚩 Census — это платформа для операционной аналитики с обратным ETL (извлечение, преобразование, загрузка) и единое надежное пространство для переноса данных из хранилища в ваши повседневные приложения.
Аналитику можно рассматривать как код и конфигурацию, которые описывают действия с данными для получения обработанной информации. Так работа с данными будет воспроизводима, ее можно интегрировать в конвейер и быть более гибкими, когда изменяем инфраструктуру.
Надежный воспроизводимый пайплайн для обработки и получения данных позволяет представить аналитику в виде кода.
🚩 dbt позволяет развертывать аналитический код в короткие сроки с помощью модульности, переносимости, CI/CD и документации.
Мало получить информацию, ее еще надо обработать. Эти решения должны быть легко масштабируемыми, ведь представление данных в качестве платформы — это главная задача DataOps-инженера. Такая методология позволяет разработчикам запускать свои среды для быстрого прототипирования, получать данные здесь и сейчас и на их основе уже создавать продукты.
🚩 Databricks Lakehouse — это комплексная платформа управления данными, которая объединяет сценарии использования хранилища данных и ИИ через веб-интерфейс, интерфейс командной строки и SDK.
#devops #dataops
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥2👍1
Вот что можно делать с помощью системы:
Вы можете развернуть DataLens на любой инфраструктуре. Пользуйтесь и делитесь с коллегами 🤝
#devops #data #dataops #yandex
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4😎2
Недавно прошел Data Platform Meetup Kazakhstan, на котором эксперты Yandex Cloud рассказали о технологических трендах ближайших лет и задачах, в которых компаниям помогают сервисы для работы с данными.
Вот самые ключевые выводы:
🟣 Демократизация машинного обучения для разных ролей и индустрий — главный тренд. Массивы данных помогают обучать модели ML, а развитие NLP позволяет применять их в аналитике: отзывы клиентов, данные социальных сетей и онлайн-обзоры.
🟣 Гибкая платформа данных позволяет бизнесу быстро запускать дата-проекты и быть максимально адаптивным к любым изменениям. Многие компании всё чаще используют облако как гибкую среду для построения корпоративных хранилищ.
🟣 Рост спроса на безопасность и контроль данных, а также запрос на простоту работы с BI-инструментами. Компании активно тестируют и внедряют бизнес-аналитику, требуя качественный UI, доступную техподдержку и возможность получать данные в режиме реального времени.
Особенно радует нас то, что казахстанские компании активно применяют сервисы Data Platform для речевой аналитики, разработки голосовых роботов, систем видеоаналитики и рекомендательных сервисов.
#devops #data #bi #dataops #dataplatform
@DevOpsKaz
Вот самые ключевые выводы:
Особенно радует нас то, что казахстанские компании активно применяют сервисы Data Platform для речевой аналитики, разработки голосовых роботов, систем видеоаналитики и рекомендательных сервисов.
#devops #data #bi #dataops #dataplatform
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4⚡2❤1
Развертывание ML-инфраструктуры позволяет обрабатывать и анализировать большие объемы данных для задач машинного обучения. Она упрощает взаимодействие между командами разработчиков, дата-сайентистов и инженеров, позволяя эффективно работать над общими проектами.
👉 Инструмент mlinfra поддерживает инструменты MLOps, развертываемые на платформе в автономном виде. В итоге команды смогут развернуть свой стек MLOps с помощью одной команды, а затем — оптимизировать процессы разработки, тестирования и мониторинга моделей машинного обучения.
Есть поддержка основных поставщиков облачных услуг, включая AWS, GCP, Azure и AliBaba.
Пользуйтесь и делитесь с коллегами 🤝
🚩 Core 24/7 — одна из немногих компаний в Казахстане, кто занимается MLOps. Мы решаем бизнес-задачи, которые требуют обработки огромных объемов данных. Обучаем и интегрируем модели машинного обучения, которые помогают автоматизировать процессы вашего бизнеса с высокой степенью надежности.
#mlops #dataops #bigdata
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4⚡3🔥2👾2