Как построить аналитическую инфраструктуру уровня PRO своими руками или с небольшой командой?
Анонс для тех, кто устал вручную выгружать и сводить данные из разных источников. На деле ситуация серьезней, чем кажется.
Часто компании работают с разными источниками данных с собственной логикой. Каждая выгрузка превращается в хоррор-квест и отнимает много времени и сил. Формально аналитика работает, но все понимают, что можно лучше.
Облегчить жизнь команде аналитики поможет правильная инфраструктура, и ее можно собрать по готовому алгоритму. А где его взять?
28 февраля в 17:00 МСК архитектор VK Cloud Алексей Белозерский проведет вебинар. Там он покажет, как с помощью облачных сервисов и открытого ПО организовать хранение, обработку и доставку данных до конечных пользователей.
В программе:
🔹Основные принципы и этапы работы с данными: DWH, ETL, BI.
🔹Проектирование системы: создание DWH, передача и обработка данных с помощью Apache Airflow и DBT, подключение BI-систему Redash.
🔹Live-demo: эксплуатация системы. Подключаем источники, редактируем витрины, обогащаем дашборды в Redash дополнительными данными.
🔹 QA-сессия.
Посетите вебинар дата-инженеров , старших аналитиков и разработчиков DWH, а также менеджеров продуктов, ориентированных на data-driven подход.
У VK Cloud большой опыт в построении различных инфраструктур. Поэтому добавьте событие в календарь.
⏰ 28.02.2024, 17:00 МСК
Зарегистрироваться
Анонс для тех, кто устал вручную выгружать и сводить данные из разных источников. На деле ситуация серьезней, чем кажется.
Часто компании работают с разными источниками данных с собственной логикой. Каждая выгрузка превращается в хоррор-квест и отнимает много времени и сил. Формально аналитика работает, но все понимают, что можно лучше.
Облегчить жизнь команде аналитики поможет правильная инфраструктура, и ее можно собрать по готовому алгоритму. А где его взять?
28 февраля в 17:00 МСК архитектор VK Cloud Алексей Белозерский проведет вебинар. Там он покажет, как с помощью облачных сервисов и открытого ПО организовать хранение, обработку и доставку данных до конечных пользователей.
В программе:
🔹Основные принципы и этапы работы с данными: DWH, ETL, BI.
🔹Проектирование системы: создание DWH, передача и обработка данных с помощью Apache Airflow и DBT, подключение BI-систему Redash.
🔹Live-demo: эксплуатация системы. Подключаем источники, редактируем витрины, обогащаем дашборды в Redash дополнительными данными.
🔹 QA-сессия.
Посетите вебинар дата-инженеров , старших аналитиков и разработчиков DWH, а также менеджеров продуктов, ориентированных на data-driven подход.
У VK Cloud большой опыт в построении различных инфраструктур. Поэтому добавьте событие в календарь.
⏰ 28.02.2024, 17:00 МСК
Зарегистрироваться
Всем привет.
Сегодня в 20:30 по москве продолжим обсуждать первую часть книги Communication Patterns: A Guide for Developers and Architects (https://www.amazon.de/-/en/Jacqueline-Read/dp/1098140540).
Присоединяйтесь слушать 🫶
https://t.me/deordie/103
Сегодня в 20:30 по москве продолжим обсуждать первую часть книги Communication Patterns: A Guide for Developers and Architects (https://www.amazon.de/-/en/Jacqueline-Read/dp/1098140540).
Присоединяйтесь слушать 🫶
https://t.me/deordie/103
Telegram
DE or DIE
Простите, обсчитались со временем, корректируем: сегодня в 20:30 по Москве.
Но все так же ждем всех желающих 🙂
Но все так же ждем всех желающих 🙂
One Day Offer для Data Science ⚡
Обнаружен самый короткий путь к офферу в Сбере: 2 марта ждём вас на онлайн One Day Offer для специалистов Data Science.
Мы разрабатываем и внедряем DS-решения в точки касания клиента со Сбером: отделения, мобильное приложение, банкоматная сеть, кол-центр, канал Премьер и т. д. За год мы разрабатываем и внедряем более 200 моделей.
Наш стек: Python, Spark, SQL, Hadoop, GreenPlum.
В ваших задачах будет 👇
— Обучение всех типов моделей искусственного интеллекта: от классического ML до глубоких нейронных сетей.
— Создание высокотехнологичных сервисов: от систем принятия решений до компьютерного зрения и обработки естественного языка.
— Развитие хранилищ блока на Teradata и DataLake на Hadoop.
У вас есть уникальная возможность поучаствовать в выводе продуктов с нуля в промышленную эксплуатацию. Интересно? Регистрируйтесь по ссылке 😉
Обнаружен самый короткий путь к офферу в Сбере: 2 марта ждём вас на онлайн One Day Offer для специалистов Data Science.
Мы разрабатываем и внедряем DS-решения в точки касания клиента со Сбером: отделения, мобильное приложение, банкоматная сеть, кол-центр, канал Премьер и т. д. За год мы разрабатываем и внедряем более 200 моделей.
Наш стек: Python, Spark, SQL, Hadoop, GreenPlum.
В ваших задачах будет 👇
— Обучение всех типов моделей искусственного интеллекта: от классического ML до глубоких нейронных сетей.
— Создание высокотехнологичных сервисов: от систем принятия решений до компьютерного зрения и обработки естественного языка.
— Развитие хранилищ блока на Teradata и DataLake на Hadoop.
У вас есть уникальная возможность поучаствовать в выводе продуктов с нуля в промышленную эксплуатацию. Интересно? Регистрируйтесь по ссылке 😉
Привет! Это Podlodka Crew, мы организовываем IT-конференции онлайн по разным технологиям.
Уже 11 марта у нас стартует новый сезон по Java с актуальной темой «Интеграции между сервисами».
С интеграциями мы сталкиваемся каждый день и вынуждены разбираться, какие выбирать и как их правильно реализовать.
В этом сезоне обсудим best practices, научимся их применять в реальной жизни, развенчаем популярные мифы:
🌟Звёздная рулетка кейсов с Филлипом Дельгядо, Гришей Кошелевым, Владимиром Картяевым и Кириллом Ветчинкиным. Выясним, когда использовать синхронное, а когда асинхронное взаимодействие. Всё это — на примере задач из опыта спикеров.
🌟 Рассмотрим современный клиент NoSQL баз данных вместе с Артёмом Дубининым из VK и Tarantool. Подружим Java с NoSQL базами данных, поймём, какой API использовать, подберём интерфейсы к серверу и кластеру. Изучим опыт внедрения Spring Data API.
🌟Обсудим легенды и мифы REST API: существует ли он и как его разрабатывать. А ещё окунёмся в best-practices разработки JSON HTTP API и затронем вопросы синергии REST с современными микросервисными архитектурами.
Это не все доклады нового сезона! Приходи на сайт смотреть подробное расписание и забирай свой билет: https://podlodka.io/javacrew
Реклама. ИП Толстая Елена Петровна ИНН:507503278104, erid:2SDnjc31dkt
Уже 11 марта у нас стартует новый сезон по Java с актуальной темой «Интеграции между сервисами».
С интеграциями мы сталкиваемся каждый день и вынуждены разбираться, какие выбирать и как их правильно реализовать.
В этом сезоне обсудим best practices, научимся их применять в реальной жизни, развенчаем популярные мифы:
🌟Звёздная рулетка кейсов с Филлипом Дельгядо, Гришей Кошелевым, Владимиром Картяевым и Кириллом Ветчинкиным. Выясним, когда использовать синхронное, а когда асинхронное взаимодействие. Всё это — на примере задач из опыта спикеров.
🌟 Рассмотрим современный клиент NoSQL баз данных вместе с Артёмом Дубининым из VK и Tarantool. Подружим Java с NoSQL базами данных, поймём, какой API использовать, подберём интерфейсы к серверу и кластеру. Изучим опыт внедрения Spring Data API.
🌟Обсудим легенды и мифы REST API: существует ли он и как его разрабатывать. А ещё окунёмся в best-practices разработки JSON HTTP API и затронем вопросы синергии REST с современными микросервисными архитектурами.
Это не все доклады нового сезона! Приходи на сайт смотреть подробное расписание и забирай свой билет: https://podlodka.io/javacrew
Реклама. ИП Толстая Елена Петровна ИНН:507503278104, erid:2SDnjc31dkt
“От монолита к микросервисам. Глава 1 Основные сведения о микросервисах / Филипп Дельгядо”.
В рамках обсуждения первой главы рассмотрели понятия микросервисов и их отличия от монолитов, а также обсудили преимущества и недостатки каждого подхода. Также мы поговорили о таких ключевых понятиях, как "Cohesion" и "Coupling".
https://youtube.com/live/VNCSWWum3sg
В рамках обсуждения первой главы рассмотрели понятия микросервисов и их отличия от монолитов, а также обсудили преимущества и недостатки каждого подхода. Также мы поговорили о таких ключевых понятиях, как "Cohesion" и "Coupling".
https://youtube.com/live/VNCSWWum3sg
YouTube
От монолита к микросервисам. Глава 1 Основные сведения о микросервисах / Филипп Дельгядо
В рамках обсуждения первой главы мы рассмотрим понятия микросервисов и их отличия от монолитов, а также обсудим преимущества и недостатки каждого подхода. Также мы поговорим о таких ключевых понятиях, как "Cohesion" и "Coupling".
Канал с анонсами https:…
Канал с анонсами https:…
VK Kubernetes Conf — первая Kubernetes-конференция 2024 года
⏰ 28.03.2024, 14:00 МСК
28 марта VK Cloud проведёт новую конференцию VK Kubernetes Conf, чтобы команды, которые работают с оркестратором и накапливают колоссальный опыт, могли поделиться им с сообществом.
Основной темой обсуждения внутри комьюнити была и остается сложность оркестратора: растёт количество инструментов, усложняются архитектурные паттерны, повышаются требования к ИБ и к администрированию решений — защищенность Kubernetes становится приоритетом №1. Первое K8s-событие этого года будет посвящено отказоустойчивости и аварийному восстановлению, уязвимостям кластеров и тому, как с ними бороться. Спикеры и участники обсудят сценарии применения Kubernetes, которые в последние годы набирают обороты, среди них — работа с данными и ML.
Спикерами конференции станут эксперты из «Тинькофф», VK, Wildberries, VK Cloud, Газпромбанка, билайна и других компаний. Доклады помогут решить типичные проблемы пользователей оркестратора, а также просто расширят кругозор, чтобы в непредвиденных ситуациях каждый специалист понимал вектор подходов к решению аварийной или среднестатистической задачи на своих проектах.
VK Kubernetes Conf — это повод встретиться с сообществом и обменяться опытом, получить совет от специалистов и просто хорошо провести время с людьми, которые говорят с тобой на одном языке.
Конференция будет интересна разработчикам, инженерам доступности сервисов (SRE), DevOps и DevSecOps-инженерам, архитекторам, тестировщикам и всем, кто работает с Kubernetes.
Регистрация
⏰ 28.03.2024, 14:00 МСК
28 марта VK Cloud проведёт новую конференцию VK Kubernetes Conf, чтобы команды, которые работают с оркестратором и накапливают колоссальный опыт, могли поделиться им с сообществом.
Основной темой обсуждения внутри комьюнити была и остается сложность оркестратора: растёт количество инструментов, усложняются архитектурные паттерны, повышаются требования к ИБ и к администрированию решений — защищенность Kubernetes становится приоритетом №1. Первое K8s-событие этого года будет посвящено отказоустойчивости и аварийному восстановлению, уязвимостям кластеров и тому, как с ними бороться. Спикеры и участники обсудят сценарии применения Kubernetes, которые в последние годы набирают обороты, среди них — работа с данными и ML.
Спикерами конференции станут эксперты из «Тинькофф», VK, Wildberries, VK Cloud, Газпромбанка, билайна и других компаний. Доклады помогут решить типичные проблемы пользователей оркестратора, а также просто расширят кругозор, чтобы в непредвиденных ситуациях каждый специалист понимал вектор подходов к решению аварийной или среднестатистической задачи на своих проектах.
VK Kubernetes Conf — это повод встретиться с сообществом и обменяться опытом, получить совет от специалистов и просто хорошо провести время с людьми, которые говорят с тобой на одном языке.
Конференция будет интересна разработчикам, инженерам доступности сервисов (SRE), DevOps и DevSecOps-инженерам, архитекторам, тестировщикам и всем, кто работает с Kubernetes.
Регистрация
Forwarded from BI & DA events (Николай Крупий)
Telegram
Data Events
20 марта, 14:00, онлайн и офлайн в Москве
UNION ALL — большая конференцию о технологиях и эффективных решениях для работы с данными
На конференции расскажут про возможности #YandexGPT, работу с собственными ML-моделями, поделятся важными новостями Yandex…
UNION ALL — большая конференцию о технологиях и эффективных решениях для работы с данными
На конференции расскажут про возможности #YandexGPT, работу с собственными ML-моделями, поделятся важными новостями Yandex…
Forwarded from YTsaurus Community Chat (RU)
Всем привет!
У нас сегодня важная дата — ровно год назад мы вышли в опенсорс! ✨ за год у нас уже более 1700 звёзд и 100 форков на GitHub, а также вы — наше большое сообщество пользователей и контрибьюторов. Хотим сказать огромное спасибо — что пользуетесь, задаете вопросы, приносите issues и всячески поддерживаете. Дальше — больше!
А ещё мы пришли с подарками — новой версией YTsaurus и ещё несколькими ключевыми обновлениями. О них вы можете прочитать в блоге (да, теперь у нас есть блог!) на нашем сайте.
Рассказывайте о нас друзьям и коллегам, подписывайтесь на наш YouTube и ставьте звёзды — будем очень рады.
У нас сегодня важная дата — ровно год назад мы вышли в опенсорс! ✨ за год у нас уже более 1700 звёзд и 100 форков на GitHub, а также вы — наше большое сообщество пользователей и контрибьюторов. Хотим сказать огромное спасибо — что пользуетесь, задаете вопросы, приносите issues и всячески поддерживаете. Дальше — больше!
А ещё мы пришли с подарками — новой версией YTsaurus и ещё несколькими ключевыми обновлениями. О них вы можете прочитать в блоге (да, теперь у нас есть блог!) на нашем сайте.
Рассказывайте о нас друзьям и коллегам, подписывайтесь на наш YouTube и ставьте звёзды — будем очень рады.
Мы всегда ищем способы сделать инженерию данных проще и удобнее. Роман Зыков создал полностью рабочую систему, которой хочет поделиться с вами!
При этом он отказался от использования знакомых инструментов.
🔍 Что мы обсудим на вебинаре:
🔸Почему выбрал DuckDB для разработки data приложений, отказавшись от привычных инструментов.
🔸Как построил полностью рабочую систему с базой данных, dbt, и оркестратором для ежедневного обновления данных без использования облачных сервисов.
🔸Живые примеры и исходные коды проекта.
🔸Управление данными с помощью #DBT и Prefect.io.
👨💻 Приходите на вебинар, если вы хотите:
• Узнать, как использовать #DuckDB для создания эффективных data приложений.
• Познакомиться с бесплатными инструментами для инжиниринга данных.
• Вдохновиться реальным проектом и увидеть, как можно управлять данными без облаков.
#datalearn #вебинар #DuckDB #DBT #Prefect
https://t.me/rockyourdata/4608
Please open Telegram to view this post
VIEW IN TELEGRAM
📆 23 апреля, с 09:00 до 19:00, Москва.
Отраслевая дата-конференция для CDO и DWH-архитекторов.
Ключевая тема — бизнес-результаты, полученные благодаря работе с данными и проектам, реализованным на российском ПО. Спикеры: ВТБ, «Газпромбанк», «Норникель», «Вкусно — и точка», «Детский мир», «Бургер Кинг», «Почта России», «Тинькофф Банк» и Unilever.
📌 Также на мероприятии:
— тренды в работе с данными;
— обзор функционала и roadmap развития дата-платформы Arenadata;
— дискуссия по проблематике проектов, реализованных в облаках (с участием VK Cloud Solutions, Cloud.ru, «Облако КРОК», Beeline Cloud, CloudMTS и Т1 Cloud).
— обзор состояния и перспектив рынка данных в России.
🏢 Место: отель Hyatt Regency Moscow Petrovsky Park.
🎦 Гибридный формат (онлайн + офлайн)
➡️ Регистрация здесь
Отраслевая дата-конференция для CDO и DWH-архитекторов.
Ключевая тема — бизнес-результаты, полученные благодаря работе с данными и проектам, реализованным на российском ПО. Спикеры: ВТБ, «Газпромбанк», «Норникель», «Вкусно — и точка», «Детский мир», «Бургер Кинг», «Почта России», «Тинькофф Банк» и Unilever.
📌 Также на мероприятии:
— тренды в работе с данными;
— обзор функционала и roadmap развития дата-платформы Arenadata;
— дискуссия по проблематике проектов, реализованных в облаках (с участием VK Cloud Solutions, Cloud.ru, «Облако КРОК», Beeline Cloud, CloudMTS и Т1 Cloud).
— обзор состояния и перспектив рынка данных в России.
🏢 Место: отель Hyatt Regency Moscow Petrovsky Park.
🎦 Гибридный формат (онлайн + офлайн)
➡️ Регистрация здесь
Сегодня выкатили новую версия Apache #Airflow — 2.9. В релизе много полезных изменений и фиксов, а также новых фич:
@task.bash
декоратор. Возвращаемое значение обёрнутой в этот декоратор функции будет выполнено в виде bash-командыПолный список изменений смотри по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
Release Apache Airflow 2.9.0 · apache/airflow
Significant Changes
Following Listener API methods are considered stable and can be used for production system (were experimental feature in older Airflow versions) (#36376):
Lifecycle events:
on_...
Following Listener API methods are considered stable and can be used for production system (were experimental feature in older Airflow versions) (#36376):
Lifecycle events:
on_...
Как системному аналитику DWH попасть в Тинькофф? О чем спросят на собеседовании? Какие задачи предложат решать?
Все ответы — на Tinkoff DWH Connect. В апреле пройдут три онлайн-мероприятия для системных аналитиков DWH. Уровень мидл и выше.
Вот что будет:
— Weekend Offer, 20 и 21 апреля. Можете попасть в команду Тинькофф за пару дней. Пройдете все этапы собеседования за выходные — и, если все понравится, оффер ваш.
Посетите все три ивента или сразу приходите на собеседование.
Зарегистрируйтесь до 17 апреля. Детали тут.
erid:2VtzqwiLKyh
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673
Все ответы — на Tinkoff DWH Connect. В апреле пройдут три онлайн-мероприятия для системных аналитиков DWH. Уровень мидл и выше.
Вот что будет:
— Weekend Offer, 20 и 21 апреля. Можете попасть в команду Тинькофф за пару дней. Пройдете все этапы собеседования за выходные — и, если все понравится, оффер ваш.
Посетите все три ивента или сразу приходите на собеседование.
Зарегистрируйтесь до 17 апреля. Детали тут.
erid:2VtzqwiLKyh
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673
Как Kubernetes захватывает Data-индустрию, Trino и dbt в продакшн, как запустить риал-тайм антифрод за две недели — об этом поговорим на VK Data Meetup
⏰23 мая, 15:00-19:00 по МСК
📍Офис VK и онлайн
⚡️Бесплатная регистрация: https://bit.ly/3QkKIpv?erid=2Vtzqve4Wxx
VK Data Meetup — серия событий для дата-инженеров, разработчиков, администраторов о практиках работы с данными на разных уровнях. Майский митап посвящен актуальным архитектурным паттернам платформ данных и технологиям, которые позволят их реализовать.
Речь пойдет о DWH, Data Lake, Data LakeHouse и Data Mesh — где они применяются и с какими подводными камнями можно встретиться на практике. Узнаете, как Kubernetes незаметно, но уверенно захватывает индустрию, почему в коммьюнити все чаще говорят про Trino, как интегрировать CI/CD в работу с данными.
Мероприятие будет интересно дата-инженерам, специалистам по DWH, администраторам, архитекторам и разработчикам.
Посмотреть полную программу и зарегистрироваться: https://bit.ly/3QkKIpv?erid=2Vtzqve4Wxx
⏰23 мая, 15:00-19:00 по МСК
📍Офис VK и онлайн
⚡️Бесплатная регистрация: https://bit.ly/3QkKIpv?erid=2Vtzqve4Wxx
VK Data Meetup — серия событий для дата-инженеров, разработчиков, администраторов о практиках работы с данными на разных уровнях. Майский митап посвящен актуальным архитектурным паттернам платформ данных и технологиям, которые позволят их реализовать.
Речь пойдет о DWH, Data Lake, Data LakeHouse и Data Mesh — где они применяются и с какими подводными камнями можно встретиться на практике. Узнаете, как Kubernetes незаметно, но уверенно захватывает индустрию, почему в коммьюнити все чаще говорят про Trino, как интегрировать CI/CD в работу с данными.
Мероприятие будет интересно дата-инженерам, специалистам по DWH, администраторам, архитекторам и разработчикам.
Посмотреть полную программу и зарегистрироваться: https://bit.ly/3QkKIpv?erid=2Vtzqve4Wxx
Forwarded from Data Events via @ContestMasterBot
Внимание розыгрыш двух билетов на https://t.me/data_events/2946!
Уже участвует 4 человек.
Для присоединения к розыгрышу, нажми на кнопку ниже.
Уже участвует 4 человек.
Для присоединения к розыгрышу, нажми на кнопку ниже.
Forwarded from Инжиниринг Данных (Dmitry)
14-15 мая - Iceberg Summit. Iceberg формат для хранения данных в озере данных lake house. Если вы работаете с данными, то вы должны знать один из 3х форматов delta, iceberg, hudi.
Реально 2 доминируют Delta развивается databricksом, Iceberg сам по себе хорош и популярен.
Реально 2 доминируют Delta развивается databricksом, Iceberg сам по себе хорош и популярен.
iceberg-summit.org
Iceberg Summit
The premier event for those adopting the leading open table format.Iceberg Summit is an event sanctioned by the Apache Software Foundation to facilitate Apache Iceberg education and knowledge-sharing across data engineers, developers and architects. The event…