KazDevOps
5.29K subscribers
1.14K photos
25 videos
18 files
1.16K links
Канал о DevOps во всех проявлениях: K8s, CI/CD, AppSec, AI/ML, Cloud, Linux
Поможем с DevOps: https://core247.kz/
По рекламе @UlKonovalova
Download Telegram
Данных становится все больше и растут они с огромной скоростью. Их нужно хранить, обрабатывать и работать с ними. Тут и приходит на помощь инженерное мышление — оптимизация с подходом DataOps.

Лучшие практики DevOps подключаются к управлению данными. На чем они фокусируются?

Воспроизводимая работа с данными

Иначе говоря, а давайте не будем заново обрабатывать данные. Пайплайны должны выстраиваться вокруг внутрикомандных процессов доставки, подготовки, деплоя. При правильном построении пайплайна любая команда в любой момент может получить требуемые данные.

🚩 Census — это платформа для операционной аналитики с обратным ETL (извлечение, преобразование, загрузка) и единое надежное пространство для переноса данных из хранилища в ваши повседневные приложения.

Аналитика как код

Аналитику можно рассматривать как код и конфигурацию, которые описывают действия с данными для получения обработанной информации. Так работа с данными будет воспроизводима, ее можно интегрировать в конвейер и быть более гибкими, когда изменяем инфраструктуру.

Надежный воспроизводимый пайплайн для обработки и получения данных позволяет представить аналитику в виде кода.

🚩 dbt позволяет развертывать аналитический код в короткие сроки с помощью модульности, переносимости, CI/CD и документации.

Данные как платформа

Мало получить информацию, ее еще надо обработать. Эти решения должны быть легко масштабируемыми, ведь представление данных в качестве платформы — это главная задача DataOps-инженера. Такая методология позволяет разработчикам запускать свои среды для быстрого прототипирования, получать данные здесь и сейчас и на их основе уже создавать продукты.

🚩 Databricks Lakehouse — это комплексная платформа управления данными, которая объединяет сценарии использования хранилища данных и ИИ через веб-интерфейс, интерфейс командной строки и SDK.

#devops #dataops

@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2👍1
☄️ DataLens — система бизнес-аналитики и визуализации данных. Он был разработан и использовался в качестве основного инструмента аналитики в Яндексе, а теперь доступен как проект с открытым исходным кодом.

Вот что можно делать с помощью системы:

Создавайте графики, чтобы быстро проверить гипотезу на ваших данных. Собирайте полноценный дашборд для мониторинга ключевых бизнес-метрик.
Подключайтесь к своим облачным и локальным базам данных, сервисам и плоским файлам.
Используйте дополнительные типы подключений, шаблоны дашбордов, датасеты и геослои для обогащения собственной аналитики.

🚩 Сервис предоставляется бесплатно. Без ограничений на количество пользователей и запросов.

Вы можете развернуть DataLens на любой инфраструктуре. Пользуйтесь и делитесь с коллегами 🤝

#devops #data #dataops #yandex

@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4😎2
Недавно прошел Data Platform Meetup Kazakhstan, на котором эксперты Yandex Cloud рассказали о технологических трендах ближайших лет и задачах, в которых компаниям помогают сервисы для работы с данными.

Вот самые ключевые выводы:

🟣Демократизация машинного обучения для разных ролей и индустрий — главный тренд. Массивы данных помогают обучать модели ML, а развитие NLP позволяет применять их в аналитике: отзывы клиентов, данные социальных сетей и онлайн-обзоры.

🟣Гибкая платформа данных позволяет бизнесу быстро запускать дата-проекты и быть максимально адаптивным к любым изменениям. Многие компании всё чаще используют облако как гибкую среду для построения корпоративных хранилищ.

🟣Рост спроса на безопасность и контроль данных, а также запрос на простоту работы с BI-инструментами. Компании активно тестируют и внедряют бизнес-аналитику, требуя качественный UI, доступную техподдержку и возможность получать данные в режиме реального времени.

Особенно радует нас то, что казахстанские компании активно применяют сервисы Data Platform для речевой аналитики, разработки голосовых роботов, систем видеоаналитики и рекомендательных сервисов.

#devops #data #bi #dataops #dataplatform

@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥421
🔥 Развертывание инфраструктуры MLOps в публичных облаках

Развертывание ML-инфраструктуры позволяет обрабатывать и анализировать большие объемы данных для задач машинного обучения. Она упрощает взаимодействие между командами разработчиков, дата-сайентистов и инженеров, позволяя эффективно работать над общими проектами.

👉 Инструмент mlinfra поддерживает инструменты MLOps, развертываемые на платформе в автономном виде. В итоге команды смогут развернуть свой стек MLOps с помощью одной команды, а затем — оптимизировать процессы разработки, тестирования и мониторинга моделей машинного обучения.

Есть поддержка основных поставщиков облачных услуг, включая AWS, GCP, Azure и AliBaba.

Пользуйтесь и делитесь с коллегами 🤝

🚩 Core 24/7 — одна из немногих компаний в Казахстане, кто занимается MLOps. Мы решаем бизнес-задачи, которые требуют обработки огромных объемов данных. Обучаем и интегрируем модели машинного обучения, которые помогают автоматизировать процессы вашего бизнеса с высокой степенью надежности.


#mlops #dataops #bigdata

@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥2👾2