SQL & Hibernate (лекции JavaRush)
Неплохой набор лекций по работе с базами данных.
Что относится к Java разработке можно пролистать.
https://javarush.com/quests/QUEST_SQL_HIBERNATE_PUBLIC
Неплохой набор лекций по работе с базами данных.
Что относится к Java разработке можно пролистать.
https://javarush.com/quests/QUEST_SQL_HIBERNATE_PUBLIC
JavaRush
SQL & Hibernate
Квест посвящен продвинутому изучению БД в разрезе задач разработчика. Вы узнаете о том, зачем нужны БД и какими они бывают, о проектировании БД, типах данных, ORM Hibernate (архитектура Hibernate, конфигурация, основные аннотации, получение, обновление и…
Data Engineering Zoomcamp 2025 Cohort
_ _ _ Б Е С П Л А Т Н О _ _ _
Start: 13 January 2025
Registration link: https://airtable.com/shr6oVXeQvSI5HuWD
Materials specific to the cohort: cohorts/2025/
https://github.com/DataTalksClub/data-engineering-zoomcamp
_ _ _ Б Е С П Л А Т Н О _ _ _
Start: 13 January 2025
Registration link: https://airtable.com/shr6oVXeQvSI5HuWD
Materials specific to the cohort: cohorts/2025/
https://github.com/DataTalksClub/data-engineering-zoomcamp
GitHub
GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals…
Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals of data engineering. - DataTalksClub/data-engineering-zoomcamp
👍6
PySpark Playground & Tutorial
https://www.sparkplayground.com/tutorials - здесь можно изучить работу со спарком (на английском)
https://www.sparkplayground.com/playground - здесь можно потренироваться онлайн
#spark #pyspark
https://www.sparkplayground.com/tutorials - здесь можно изучить работу со спарком (на английском)
https://www.sparkplayground.com/playground - здесь можно потренироваться онлайн
#spark #pyspark
Spark Playground
Platform to learn, practice, and solve PySpark interview questions to land your next DE role.
🔥8
В видео по Spark есть ссылка на роадмап по DE с кучей полезных инструкций по инструментам.
GitHub - halltape/HalltapeRoadmapDE: Roadmap для Data Engineer.
https://github.com/halltape/HalltapeRoadmapDE
GitHub - halltape/HalltapeRoadmapDE: Roadmap для Data Engineer.
https://github.com/halltape/HalltapeRoadmapDE
Оптимизация SQL запросов на примере ClickHouse
Бесплатно
Научимся писать SQL запросы так, чтобы не убить базу данных. Изучим основные методы оптимизации SQL запросов, актуальные для любой СУБД
https://stepik.org/course/Оптимизация-SQL-запросов-на-примере-ClickHouse-215412/
#ClickHouse
Бесплатно
Научимся писать SQL запросы так, чтобы не убить базу данных. Изучим основные методы оптимизации SQL запросов, актуальные для любой СУБД
https://stepik.org/course/Оптимизация-SQL-запросов-на-примере-ClickHouse-215412/
#ClickHouse
Stepik: online education
Оптимизация SQL запросов на примере ClickHouse
Научимся писать SQL запросы так, чтобы не убить базу данных. Изучим основные методы оптимизации SQL запросов, актуальные для любой СУБД
❤8👎1🔥1
Awesome Data Engineering Learning Sources - Roadmap для инженеров данных
Подборка ресурсов для изучения направления Data Engineering с минимальным бюджетом (большая часть бесплатно на YT).
https://datatalks.ru/awesome-data-engineering-learning-sources/
Подборка ресурсов для изучения направления Data Engineering с минимальным бюджетом (большая часть бесплатно на YT).
https://datatalks.ru/awesome-data-engineering-learning-sources/
DataTalks.RU. Data Engineering / DWH / Data Pipeline
Awesome Data Engineering. Дорожная карта Data Engineer RoadMap
Awesome Data Engineering. Дорожная карта Data Engineer RoadMap. Дорожная карта по изучению инженерии данных. Как стать дата инженером?
🔥7👍3
Перевод главы "Введение в dbt" из книги Unlocking dbt
https://datatalks.ru/unlocking-dbt-data-build-tool-part-1/
#dbt
https://datatalks.ru/unlocking-dbt-data-build-tool-part-1/
#dbt
DataTalks.RU. Data Engineering / DWH / Data Pipeline
Перевод главы «Введение в dbt» из книги Unlocking dbt
Введение в dbt В 2006 году британский математик и предприниматель в области анализа данных Клайв Хамби ввел фразу: «Данные — это новая нефть», подчеркнув их невероятно высокую ценность. Как и нефть, данные в сыром виде полезны, но их нужно обработать, чтобы…
🔥13
Как устроена база данных? Схемы, ограничения, индексы, кластеры
Для начинающих будет полезно
https://youtu.be/8L51FUsjMxA?si=z8uPvZjbnphQC3cx
Для начинающих будет полезно
https://youtu.be/8L51FUsjMxA?si=z8uPvZjbnphQC3cx
YouTube
Как устроена База Данных? Кластеры, индексы, схемы, ограничения
Разбираемся с кластером, базами, схемами, ограничениями и индексами.
Выбирайте подходящие сервисы для хранения данных в Selectel: https://slc.tl/j0mh4
Готовься к собеседованию на Солвит: https://clck.ru/3FPmdz
Телеграм канал Артём Шумейко: https://t.me/artemshumeiko…
Выбирайте подходящие сервисы для хранения данных в Selectel: https://slc.tl/j0mh4
Готовься к собеседованию на Солвит: https://clck.ru/3FPmdz
Телеграм канал Артём Шумейко: https://t.me/artemshumeiko…
👍2👀2👎1
Apache Iceberg + StarRocks YouTube Playlist
StarRocks as LakeHouse Query Engine
24 видосика.
https://youtu.be/8Q5Vev4O1lQ?si=7DIuO3IuIOmf6aHi
=== PS ===
В доке пишут, что StarRocks превосходит по производительности ClickHouse и Trino https://docs.starrocks.io/docs/benchmarking/
Понятно, что надо смотреть на типы задач, настройки и структуры данных, но интересный инструмент в любом случае.
Еще 1 статья Сравнение трино и старрокс https://gavrilov.info/all/sravnenie-query-dvizhkov-trino-i-starrocks/
#Iceberg #StarRocks
StarRocks as LakeHouse Query Engine
24 видосика.
https://youtu.be/8Q5Vev4O1lQ?si=7DIuO3IuIOmf6aHi
=== PS ===
В доке пишут, что StarRocks превосходит по производительности ClickHouse и Trino https://docs.starrocks.io/docs/benchmarking/
Понятно, что надо смотреть на типы задач, настройки и структуры данных, но интересный инструмент в любом случае.
Еще 1 статья Сравнение трино и старрокс https://gavrilov.info/all/sravnenie-query-dvizhkov-trino-i-starrocks/
#Iceberg #StarRocks
YouTube
Apache Iceberg + StarRocks: Your Recipe for Superior Lakehouse Performance
Apache Iceberg brought reliability and simplicity to the open data lake, and now it’s helping drive query performance too. Thanks to new integrations with the StarRocks project, Apache Iceberg users no longer need to copy their data into a proprietary data…
👍3
Перевод Analytics Engineering with SQL and dbt. Глава 1
Немного о концепции Analytics Engineering и терминологии.
https://datatalks.ru/analytics-engineering-with-sql-and-dbt-chapter-1/
#dbt
Немного о концепции Analytics Engineering и терминологии.
https://datatalks.ru/analytics-engineering-with-sql-and-dbt-chapter-1/
#dbt
DataTalks.RU. Data Engineering / DWH / Data Pipeline
Перевод Analytics Engineering with SQL and dbt. Глава 1
Инженерия аналитики (Analytics Engineering) История аналитики включает важные этапы и технологии, которые сформировали эту область в том виде, какой мы знаем сегодня. Всё началось с появления концепции хранилищ данных в 1980-х годах, что стало основой для…
🔥8
Понимание инкрементальных стратегий dbt, часть 1
Вторую часть не буду переводить, этот перевод сделал больше с целью ознакомить с вариантами обновления данных в таблицах. По технической реализации лучше доку смотреть и анализировать, как каждая стратегия работает на уровне макросов (или сгенерированного sql).
https://datatalks.ru/understanding-dbt-incremental-strategies-part-1/
#dbt
Вторую часть не буду переводить, этот перевод сделал больше с целью ознакомить с вариантами обновления данных в таблицах. По технической реализации лучше доку смотреть и анализировать, как каждая стратегия работает на уровне макросов (или сгенерированного sql).
https://datatalks.ru/understanding-dbt-incremental-strategies-part-1/
#dbt
DataTalks.RU. Data Engineering / DWH / Data Pipeline
Понимание инкрементальных стратегий dbt, часть 1
Перевод статьи, исходный текст: https://medium.com/indiciumtech/understanding-dbt-incremental-strategies-part-1-2-22bd97c7eeb5 Данный перевод выполнен с небольшими примечаниями. Используйте статью как ориентир, проверяя по каждой базе и каждому адаптеру возможность…
🔥3👍1
Курс по dbt для инженеров данных
https://youtube.com/playlist?list=PLzvuaEeolxkyx7XruoatSFdYDyLji_o1J&si=oH5Bne-fU2lCqJl1
#dbt
https://youtube.com/playlist?list=PLzvuaEeolxkyx7XruoatSFdYDyLji_o1J&si=oH5Bne-fU2lCqJl1
#dbt
YouTube
Курс по dbt для инженеров данных
Страница курса https://itempuniversity.com/course/view.php?id=684 Задавайте вопросы и следите за новыми курсами в телеграм канале и группе: https://t.me/dwhl...
👍12❤7
Перевод 2 главы "Моделирование данных для аналитики (dbt)"
https://datatalks.ru/dbt-data-modeling-for-analytics/
#dbt
https://datatalks.ru/dbt-data-modeling-for-analytics/
#dbt
DataTalks.RU. Data Engineering / DWH / Data Pipeline
Перевод 2 главы «Моделирование данных для аналитики (dbt)»
Перевод 2 главы "Моделирование данных для аналитики" книги Analytics Engineering with sql and dbt. Модели данных Звезда, Снежинка Data Vault
❤10👍1
Чеклист для разработчиков по подготовке к техническому собеседованию — bool.dev
https://bool.dev/blog/detail/checklist-dlya-deva-po-podgotovke-tech-interview
https://bool.dev/blog/detail/checklist-dlya-deva-po-podgotovke-tech-interview
bool.dev
Чеклист для разработчиков по подготовке к техническому собеседованию
В данной статье описываем как подготовиться к техническому собеседованию и какие темы стоит повторить
🔥5
data load tool (dlt) is an open source Python library that makes data loading easy 🛠️
🔹Автоматическая схема: проверка структуры данных и создание схемы для места назначения.
🔹 Нормализация данных: согласованные и проверенные данные перед загрузкой.
🔹Полная интеграция: Colab, AWS Lambda, Airflow и локальные среды.
🔹Масштабируемость: адаптируется к растущим потребностям в данных в производстве.
🔹Простота обслуживания: понятная структура конвейера данных для обновлений.
🔹Быстрое исследование: быстрое исследование и получение информации из новых источников данных.
🔹Универсальное использование: подходит для несистематических исследований и создания сложных погрузочных инфраструктур.
🔹Начните работу за считанные секунды с помощью CLI: Мощный CLI для управления, развертывания и проверки локальных pipelines.
🔹Поэтапная загрузка: загружайте только новые или измененные данные и избегайте повторной загрузки старых записей.
🔹Открытый исходный код: бесплатно и под лицензией Apache 2.0.
https://github.com/dlt-hub/dlt
🔹Автоматическая схема: проверка структуры данных и создание схемы для места назначения.
🔹 Нормализация данных: согласованные и проверенные данные перед загрузкой.
🔹Полная интеграция: Colab, AWS Lambda, Airflow и локальные среды.
🔹Масштабируемость: адаптируется к растущим потребностям в данных в производстве.
🔹Простота обслуживания: понятная структура конвейера данных для обновлений.
🔹Быстрое исследование: быстрое исследование и получение информации из новых источников данных.
🔹Универсальное использование: подходит для несистематических исследований и создания сложных погрузочных инфраструктур.
🔹Начните работу за считанные секунды с помощью CLI: Мощный CLI для управления, развертывания и проверки локальных pipelines.
🔹Поэтапная загрузка: загружайте только новые или измененные данные и избегайте повторной загрузки старых записей.
🔹Открытый исходный код: бесплатно и под лицензией Apache 2.0.
https://github.com/dlt-hub/dlt
GitHub
GitHub - dlt-hub/dlt: data load tool (dlt) is an open source Python library that makes data loading easy 🛠️
data load tool (dlt) is an open source Python library that makes data loading easy 🛠️ - GitHub - dlt-hub/dlt: data load tool (dlt) is an open source Python library that makes data loading easy 🛠️
👍4