DE – Telegram

https://x.com/DataSuperNerd/status/1777596108371345485

#pandas #duckdb

🆒4❤‍🔥1

275 viewsedited 07:54

🚀 Вебинара: "Разработка data приложений на DuckDB"

🎙Спикер - Роман Зыков

🔗

Ссылка

Рома создал полностью рабочую систему, которой хочет поделиться с вами!
При этом он отказался от использования знакомых инструментов.

🔍 На вебинаре обсуждает:

🟡Почему выбрал DuckDB для разработки data приложений, отказавшись от привычных инструментов.
🟡Как построил полностью рабочую систему с базой данных, dbt, и оркестратором для ежедневного обновления данных без использования облачных сервисов.
🟡Живые примеры и исходные коды проекта.
🟡Управление данными с помощью DBT и Prefect.

👨‍💻 Смотри вебинар, если хочешь:

🔜 Узнать, как использовать DuckDB для создания эффективных data приложений.

🔜 Познакомиться с бесплатными инструментами для инжиниринга данных.

🔜 Вдохновиться реальным проектом и увидеть, как можно управлять данными без облаков.

#duckdb #dbt #prefect

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Разработка data приложений на DuckDB

🎙Спикер - Роман Зыков.
Очень крутой спец, который уже дважды выступал у нас 🎙
Ссылка на презентацию вебинара: https://drive.google.com/file/d/1bkyyjmWMZ9ebTVuWA5BhywoxyKzU5kpf/view?usp=drive_link

Мы всегда ищем способы сделать инженерию данных проще и…

❤‍🔥3

332 views12:03

🦆

DuckDB: Простота работы с CSV файлами

Традиционные базы данных требуют предварительно определённой схемы таблицы и не поддерживают работу с CSV файлами без предварительной обработки. DuckDB решает эту проблему, позволяя напрямую считывать файлы CSV. Это устраняет необходимость в явном создании таблицы и загрузке данных, значительно упрощая процесс работы с данными.

👩‍💻

Github

#db #postgres #duckdb

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥6

360 views16:22

🐍

🦆

Построение эффективных дата-пайплайнов с помощью Python и DuckDB

TL;DR: DuckDB делает обработку данных дешёвой и простой. Покажу, как эффективно использовать DuckDB в цикле постов

👇

0⃣

Прелюдия

1️⃣

Начало

2️⃣ Проект

#duckdb #python #etl #de #elt

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥63👏1

348 viewsedited 05:56

0⃣-й пост из цикла.

Прелюдия

🔘Ты ежедневно обрабатываешь несколько ГБ данных, но тратишь часы на настройку/отладку масштабных систем обработки данных? Кто бы ни создавал инфраструктуру данных, он скорее всего скопировал её из какого-то блога/выступления крупной технологической компании!

🔘Представь, что внезапно ответственность за управление расходами команд обработки данных легла на твои плечи. Тебе приходится тщательно проверять все расходы на систему, какими бы незначительными они ни были, чтобы сэкономить немного денег для компании.

🔘Может быть неприятно, когда поставщики данных взимают с компании кучу денег и с радостью возьмут ещё больше, если ты не будешь осторожен с использованием доставшегося тебе легаси.

🔘Представь себе, если бы затраты на обработку данных были очень дешёвыми! Представь себе, что ты можешь быстро воспроизводить и отлаживать проблемы на своем ноутбуке!

🔘В цикле постов расскажу, как использовать последние достижения в области систем обработки данных и дешёвое оборудование для обеспечения дешёвой обработки данных. Буду использовать DuckDB и Python, чтобы показать, как быстро и дёшево обрабатывать данные, одновременно улучшая эргономику разработчиков.

#duckdb #python #etl #de #elt

Please open Telegram to view this post

VIEW IN TELEGRAM

386 viewsedited 06:03

1️⃣-й пост из цикла

Начало

Если ты активно работаешь с данными, ты, вероятно, сталкивался с такими системами, как Snowflake, Databricks, Kafka и т.д., о которых было написано много статей о том, как они произвели революцию в обработке данных.

Однако, несмотря на всю эту шумиху, многие компании поняли, что всё это быстро становится дорогостоящим. Мониторинг и отработка отказов обходятся дорого, особенно в таких системах, как Kafka, Apache Spark и Snowflake, в которых много узлов.

Если тебе интересно:

🔜 Как будущее уходит от распределенных вычислений?

🔜 Почему компании тратят умопомрачительные суммы денег на эти бесполезные ресурсы?

🔜 Почему небольшие компании имитируют то, что делают крупные компании, не будучи при этом крупными компаниями?

🔜 Зачем нужно просматривать данные в инфракрасном диапазоне с помощью микроскопа, да ещё и переплачивать за все эти популярные инструменты?

🔜 Как избежать выплаты 1000 долларов за случайное сканирование данных.

🔜 Как избегать поставщиков данных, которые почти всегда возлагают ответственность за то, чтобы пользователи использовали их инструменты “правильным образом”?

Если да, то этот цикл постов для тебя. Представь, если бы твои затраты на обработку данных были настолько низкими, что тебе даже не пришлось бы их отслеживать!

Обсудим подход, который использует последние достижения в области обработки данных в оперативной памяти в сочетании с дешёвым и мощным железом для значительного снижения затрат на обработку данных!

#duckdb #python #etl #de #elt #kafka #spark #databricks #snowflake

Please open Telegram to view this post

VIEW IN TELEGRAM

🐍🦆

Построение эффективных дата-пайплайнов с помощью Python и DuckDB

TL;DR: DuckDB делает обработку данных дешёвой и простой. Покажу, как эффективно использовать DuckDB в цикле постов

👇👇👇

0⃣ Прелюдия

1️⃣ Начало

2️⃣ Проект
…

494 views06:10

DB Quacks

Бесплатный интерактивный курс по SQL и DuckDB, где вместо сухой теории ты вводишь запросы и сразу получаешь результат. Всё в стиле аркадной игры: удобно, весело и полезно.

Идеально для первых шагов в аналитике и работе с данными.

#sql #de #duckdb

❤‍🔥6👏21

182 views03:48

About

Blog

Apps

Platform