Приветствую тебя в рядах OpenSource, о великий Datalens https://datalens.tech/
Кажется, что сегодня у Russian BI разработчиков пригорит 😏
🔹 Хабр: BI-инструмент от Яндекса DataLens — теперь в опенсорсе
~~~
Исходный код DataLens состоит из трех основных частей:
🔹 Пользовательский интерфейс — это SPA-приложение с соответствующей частью Node.js. Он предоставляет пользовательский интерфейс, передает запросы пользователей к серверным службам, а также применяет некоторую легкую постобработку данных для диаграмм.
🔹 Бэкэнд — это набор приложений и библиотек Python. Он отвечает за подключение к источникам данных, формирование запросов к ним и постобработку данных (включая вычисления по формулам). Результатом этой работы является абстрактный набор данных, который можно использовать в пользовательском интерфейсе для запроса данных диаграмм.
🔹 UnitedStorage (US) — это служба Node.js, которая использует PostgreSQL для хранения метаданных и конфигурации всех объектов DataLens.
Кажется, что сегодня у Russian BI разработчиков пригорит 😏
🔹 Хабр: BI-инструмент от Яндекса DataLens — теперь в опенсорсе
~~~
Исходный код DataLens состоит из трех основных частей:
🔹 Пользовательский интерфейс — это SPA-приложение с соответствующей частью Node.js. Он предоставляет пользовательский интерфейс, передает запросы пользователей к серверным службам, а также применяет некоторую легкую постобработку данных для диаграмм.
🔹 Бэкэнд — это набор приложений и библиотек Python. Он отвечает за подключение к источникам данных, формирование запросов к ним и постобработку данных (включая вычисления по формулам). Результатом этой работы является абстрактный набор данных, который можно использовать в пользовательском интерфейсе для запроса данных диаграмм.
🔹 UnitedStorage (US) — это служба Node.js, которая использует PostgreSQL для хранения метаданных и конфигурации всех объектов DataLens.
DataLens
A modern, scalable analytics system with a user-friendly interface and native integration with other Yandex open-source products.
🔥2❤1
An ETL example for Yandex.Tracker. Export issue metadata & agile metrics to OLAP data storage
https://github.com/akimrx/yandex-tracker-exporter
https://github.com/akimrx/yandex-tracker-exporter
GitHub
GitHub - akimrx/yandex-tracker-exporter: ETL tool for Yandex.Tracker. Export, transform and load issue metadata, changelog and…
ETL tool for Yandex.Tracker. Export, transform and load issue metadata, changelog and agile metrics to Clickhouse storage. - akimrx/yandex-tracker-exporter
Что нужно знать бэкенд-разработчику web-приложений.
Backend Roadmap
https://github.com/bzick/oh-my-backend
Backend Roadmap
https://github.com/bzick/oh-my-backend
GitHub
GitHub - bzick/oh-my-backend: Что нужно знать бэкенд-разработчику web-приложений. Backend Roadmap (from Junior to Senior).
Что нужно знать бэкенд-разработчику web-приложений. Backend Roadmap (from Junior to Senior). - bzick/oh-my-backend
Managed Service for ClickHouse®
🔸 Бесплатный практический курс
🔸 Семь модулей для изучения в произвольном порядке
🔸 Лучшие практики работы с ClickHouse
https://cloud.yandex.ru/training/clickhouse
🔸 Бесплатный практический курс
🔸 Семь модулей для изучения в произвольном порядке
🔸 Лучшие практики работы с ClickHouse
https://cloud.yandex.ru/training/clickhouse
yandex.cloud
Курс Managed Service for ClickHouse®
Бесплатный курс из 7 тем с теорией и практикой по проектированию и администрированию баз данных с помощью Managed Service for ClickHouse для практикующих data‑инженеров и data‑аналитиков. Свидетельство об окончании
❤4
⚡️ Github Copilot Chat in Open Beta: Now Available for All Individuals in Visual Studio and VS Code
https://www.infoq.com/news/2023/10/github-copilot-chat-open-beta/
https://www.infoq.com/news/2023/10/github-copilot-chat-open-beta/
InfoQ
GitHub Copilot Chat in Open Beta: Now Available for All Individuals in Visual Studio and VS Code
GitHub Copilot Chat is a chat interface that allows developers to ask and receive answers to coding-related questions directly within a supported IDE. It is currently in open beta and available for all GitHub Copilot individual users across Visual Studio…
Подборка статей по Apache Airflow:
🔸 Airflow DAGs, ч.1 — Основы и расписания
🔸 Airflow DAGs, ч.2 — Операторы и Датчики
🔸 Airflow DAGs, ч.3 — Проектирование DAG
🔸 Внедрение Airflow для управления Spark-джобами в ivi: надежды и костыли
🔸 Airflow vs NiFi: исследуем оркестратор для формирования витрин данных
🔸 Airflow DAGs, ч.1 — Основы и расписания
🔸 Airflow DAGs, ч.2 — Операторы и Датчики
🔸 Airflow DAGs, ч.3 — Проектирование DAG
🔸 Внедрение Airflow для управления Spark-джобами в ivi: надежды и костыли
🔸 Airflow vs NiFi: исследуем оркестратор для формирования витрин данных
🔥4👍2
An Overview of the End-to-End Machine Learning Workflow
In this section, we provide a high-level overview of a typical workflow for machine learning-based software development. Generally, the goal of a machine learning project is to build a statistical model by using collected data and applying machine learning algorithms to them. Therefore, every ML-based software includes three main artifacts: Data, ML Model, and Code. Corresponding to these artifacts, the typical machine learning workflow consists of three main phases:
🔹Data Engineering: data acquisition & data preparation,
🔹ML Model Engineering: ML model training & serving, and
🔹Code Engineering: integrating ML model into the final product.
In this section, we provide a high-level overview of a typical workflow for machine learning-based software development. Generally, the goal of a machine learning project is to build a statistical model by using collected data and applying machine learning algorithms to them. Therefore, every ML-based software includes three main artifacts: Data, ML Model, and Code. Corresponding to these artifacts, the typical machine learning workflow consists of three main phases:
🔹Data Engineering: data acquisition & data preparation,
🔹ML Model Engineering: ML model training & serving, and
🔹Code Engineering: integrating ML model into the final product.
Обработка данных на Apache Airflow в Yandex Cloud
https://www.youtube.com/live/jF3YemOVofQ?si=zLFx_416vByV3za9
https://www.youtube.com/live/jF3YemOVofQ?si=zLFx_416vByV3za9
YouTube
Обработка данных на Apache Airflow в Yandex Cloud
Для анализа данных в облаке не достаточно СУБД и средств визуализации — нужен ещё и понятный инструмент, который автоматизирует сбор, подготовку и обработку данных. На вебинаре мы расскали о таком сервисе — Apache Airflow.
Эксперты Yandex Cloud обсудили:…
Эксперты Yandex Cloud обсудили:…
GitHub - ripienaar/free-for-dev: A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev
https://github.com/ripienaar/free-for-dev
Free for Developers
https://free-for.dev/
https://github.com/ripienaar/free-for-dev
Free for Developers
https://free-for.dev/
GitHub
GitHub - ripienaar/free-for-dev: A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev
A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev - ripienaar/free-for-dev
❤1
Почему Trino такой быстрый: архитектура оптимизатора SQL-запросов / Хабр
https://habr.com/ru/companies/cedrusdata/articles/744934/
https://habr.com/ru/companies/cedrusdata/articles/744934/
Хабр
Почему Trino такой быстрый: архитектура оптимизатора SQL-запросов
Аналитические системы должны эффективно обрабатывать сложные пользовательские запросы к десяткам и сотням терабайт данных (пета-?). Продвинутый оптимизатор запросов является важнейшим компонентом...
👍2
Forwarded from DataEng
Курс про Apache Airflow бесплатно
Решил выложить свой курс про Apache Airflow абсолютно бесплатно для всех: Apache Airflow 2.2: практический курс
За то время что существует курс, Apache Airflow успел обрасти множеством новых фич, которые только предстоит покрыть в будущем, возможно в виде отдельных роликов на Ютуб или в виде статей у себя в блоге.
В любом случае курс не потерял своей актуальности и может послужить неплохим введением для новичков и более опытных пользователей. Например, в курсе я подробно разбираю как развернуть у себя на сервере production-ready Airflow, а также настроить автодеплой дагов через GitHub Actions.
Велком!
Решил выложить свой курс про Apache Airflow абсолютно бесплатно для всех: Apache Airflow 2.2: практический курс
За то время что существует курс, Apache Airflow успел обрасти множеством новых фич, которые только предстоит покрыть в будущем, возможно в виде отдельных роликов на Ютуб или в виде статей у себя в блоге.
В любом случае курс не потерял своей актуальности и может послужить неплохим введением для новичков и более опытных пользователей. Например, в курсе я подробно разбираю как развернуть у себя на сервере production-ready Airflow, а также настроить автодеплой дагов через GitHub Actions.
Велком!
Startdatajourney
Apache Airflow 2.2: практический курс
Практический курс по основам Apache Airflow версии 2.2 и выше
🔥7🥴2👍1
Неплохой гайд по DBT "The GitLab Handbook"
https://handbook.gitlab.com/handbook/business-technology/data-team/platform/dbt-guide/
https://handbook.gitlab.com/handbook/business-technology/data-team/platform/dbt-guide/
👍1
Курс по dbt с нуля. Занятие 1. Преимущества dbt. Запускаем dbt из docker в связке с ClickHouse
https://www.youtube.com/watch?v=fXt-VmqsVPA
https://www.youtube.com/watch?v=fXt-VmqsVPA
YouTube
Курс по dbt с нуля. Занятие 1. Преимущества dbt. Запускаем dbt из docker в связке с ClickHouse.
План занятия:
- Что такое dbt
- Преимущества dbt
- Разворачиваем ClickHouse с помощью Docker-compose
- Наполняем ClickHouse тестовыми данными
- Упаковываем dbt-clickhouse в docker контейнер
- Инициализируем проект dbt (dbt init)
- Настраиваем проект (dbt_project.yml…
- Что такое dbt
- Преимущества dbt
- Разворачиваем ClickHouse с помощью Docker-compose
- Наполняем ClickHouse тестовыми данными
- Упаковываем dbt-clickhouse в docker контейнер
- Инициализируем проект dbt (dbt init)
- Настраиваем проект (dbt_project.yml…
👍2
Курс по dbt с нуля. Занятие 2
Особенности установки на Windows.
Запуск ClickHouse в wsl 2.
https://youtu.be/wSUbJ5lUahw?si=_Q60ad9AQYk3lpQD
Особенности установки на Windows.
Запуск ClickHouse в wsl 2.
https://youtu.be/wSUbJ5lUahw?si=_Q60ad9AQYk3lpQD
YouTube
Курс по dbt с нуля. Занятие 2.2. Особенности установки на Windows. Запуск Clickhouse в wsl 2.
Домашние задания можно сдавать на странице курса по dbt: https://itempuniversity.com/course/view.php?id=684
Презентация: https://docs.google.com/presentation/d/1jLiNQOogMfUDCh0HuGmTgTq7AOEuTWBn7aAJPfSREqo/edit?usp=sharing
Если вы используете Windows, то…
Презентация: https://docs.google.com/presentation/d/1jLiNQOogMfUDCh0HuGmTgTq7AOEuTWBn7aAJPfSREqo/edit?usp=sharing
Если вы используете Windows, то…