SQL Portal | Базы Данных – Telegram

SQL Portal | Базы Данных

14.3K subscribers

888 photos

121 videos

49 files

689 links

Присоединяйтесь к нашему каналу и погрузитесь в мир баз данных

Связь: @devmangx

РКН: https://clck.ru/3H4Wo3

Download Telegram

About

Blog

Apps

Platform

SQL Portal | Базы Данных

14.3K subscribers

SQL Portal | Базы Данных

This media is not supported in your browser

VIEW IN TELEGRAM

Появилась новая игра для изучения SQL — SQL Protocol.

Она сделана в стиле «Матрицы». Внутри надо играть за агента, идти по сюжету и решать множество SQL-задач от простых к сложным. Также есть PvP Arena 🤑

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1.5K views16:07

SQL Portal | Базы Данных

JOIN против UNION в Postgres:

JOIN нужен для объединения столбцов ➡️
UNION нужен для объединения строк ⬇️

✤ JOIN объединяет столбцы из двух и более таблиц по связанному полю. Это как добавлять данные по горизонтали. Используй JOIN, когда нужно посмотреть данные из разных таблиц рядом. Пример:

SELECT employees.name, departments.location
FROM employees
JOIN departments
ON employees.dept_id = departments.id;

✤ UNION складывает результаты двух и более SELECT в один набор строк. Это про объединение данных по вертикали. Таблицы должны иметь одинаковое количество столбцов и совместимые типы данных. Пример:

SELECT city
FROM customers
UNION
SELECT city;

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1.41K views06:07

SQL Portal | Базы Данных

This media is not supported in your browser

VIEW IN TELEGRAM

Ты обожаешь Postgres и SQL, но начальству нужны отчёты в Excel? К счастью, в Postgres есть простой способ выгрузить данные из SQL-запроса сразу в CSV.

Экспортировать CSV-файл для любого SQL-запроса можно так:

psql --csv -c 'select * from orders'

psql уже содержит встроенную утилиту для работы с CSV. Просто укажи параметры подключения, запрос в кавычках — и готово.

– флаг --csv выводит данные в формате CSV прямо в stdout
– добавь >, чтобы направить вывод в файл на локальной системе

Этот способ не такой гибкий, как \copy, но для простого экспорта результатов запроса — это быстрое и удобное решение.

Прямой вывод в CSV избавляет от лишней постобработки. Нам нравится, как psql позволяет быстро и эффективно работать со структурированными данными — для отчётов, аудита и загрузки в таблицы.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤2👍2

1.51K views16:07

SQL Portal | Базы Данных

Это визуальная шпаргалка по SQL-командам, оформленная в виде рисунков с фруктами и человечками. Она охватывает основные конструкции SQL на примере таблицы fruits

По моему одна из лучших, что есть 🐸

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

1.59K views06:07

SQL Portal | Базы Данных

Внутренняя архитектура PostgreSQL

1. Архитектура на основе процессов
PostgreSQL использует архитектуру «один процесс на соединение», то есть для каждого клиента создаётся отдельный процесс операционной системы.

2. Журнал предзаписи
PostgreSQL применяет WAL для обеспечения надёжности данных, согласованности, восстановления после сбоев и репликации

3. Многоверсионность и управление параллелизмом
Благодаря MVCC PostgreSQL позволяет выполнять параллельные транзакции без необходимости жёсткой блокировки данных

4. Конвейер выполнения запросов
Запросы в PostgreSQL проходят через чёткую последовательность этапов: разбор, планирование, исполнение и возврат результатов

5. Система индексации
PostgreSQL поддерживает множество типов индексов (B-Tree, GIN, GiST, BRIN и др.) для оптимизации запросов под разные типы данных

6. Партиционирование таблиц
PostgreSQL позволяет разбивать большие таблицы на более мелкие части (партиции) по диапазону значений, списку или хешу, что упрощает управление и ускоряет обработку.

7. Логическая декодировка
Позволяет транслировать изменения из WAL в логическом формате, что полезно для репликации и систем отслеживания изменений (CDC).

8. Расширения
PostgreSQL построен как модульная система и поддерживает расширения, которые позволяют добавлять новые функции и возможности.

9. Сбор статистики
Механизм сбора статистики PostgreSQL отслеживает активность в реальном времени, что помогает анализировать и оптимизировать производительность базы данных

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1.59K views16:07

SQL Portal | Базы Данных

This media is not supported in your browser

VIEW IN TELEGRAM

Использование привязанных переменных — ключ к быстрой работе приложений

Пишите SQL вот так:

'SELECT ... WHERE col = ' || var

Каждое новое значение VAR создаёт новый запрос ⇒ много разборов ⇒ медленно

Используйте привязку вот так:

'SELECT ... WHERE col = :bind'

Один и тот же запрос для любого значения ⇒ один разбор ⇒ быстро

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1.69K views06:07

SQL Portal | Базы Данных

В Postgres 18 появилась поддержка аутентификации пользователей через OAUTH 2.0

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

1.55K views16:07

SQL Portal | Базы Данных

Что из следующего присутствует в каждой оконной функции?

Anonymous Quiz

Всё перечисленное

❤1

270 voters1.48K views06:07

SQL Portal | Базы Данных

Знаешь, что Postgres можно тюнить по одной таблице?

ALTER TABLE SET позволяет задавать отдельные параметры тюнинга, такие как fill factor, vacuum и параллельные воркеры, для конкретных нагрузок. Это более гранулярный и точный подход и может быть лучше, чем настройка на уровне всей базы данных.

Например, таблица с частыми вставками и обновлениями может использовать более агрессивное вакуумирование и уменьшенный фактор заполнения, чтобы снизить фрагментацию и ускорить записи. При этом аналитическая таблица с редкими изменениями может получить больше параллельных воркеров для ускорения чтения без влияния на остальную систему

ALTER TABLE orders
SET (
  fillfactor = 80,
  autovacuum_vacuum_scale_factor = 0.1,
  autovacuum_analyze_scale_factor = 0.05,
  parallel_workers = 4
);

ALTER TABLE events_log
SET (
  fillfactor = 70,
  autovacuum_enabled = true,
  parallel_workers = 2
);

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6

1.75K views16:07

SQL Portal | Базы Данных

Наглядный гайд с функциями от SQL до Pandas

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

1.56K views06:07

SQL Portal | Базы Данных

Media is too big

VIEW IN TELEGRAM

Многие ИИ-воркфлоу у разработчиков выглядят так:

upsert строки → вызов API → обработка через ИИ → обновление строки

А что если запускать LLM прямо в базе данных, с доступом ко всем примитивам и аутентификацией?

Чуваки открыли исходный код Postgres LLM.

- полностью асинхронно, не блокирует транзакции
- работает с любой моделью

можно быстро стартовать в supabase, не выходя из дашборда или просто передать это агенту

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1.54K views16:07

SQL Portal | Базы Данных

Пилообразные всплески ввода-вывода в Postgres часто связаны с агрессивными настройками контрольных точек.

Чтобы стабилизировать задержки, стоит увеличить параметр checkpoint_timeout.

Также имеет смысл выставить checkpoint_completion_target = 0.9, чтобы распределить нагрузку ввода-вывода более равномерно во времени.

Пример настройки в postgresql.conf:

checkpoint_timeout = 15min
checkpoint_completion_target = 0.9

Если настраивать через SQL:

ALTER SYSTEM SET checkpoint_timeout = '15min';
ALTER SYSTEM SET checkpoint_completion_target = 0.9;

SELECT pg_reload_conf();

Проверка текущих значений:

SHOW checkpoint_timeout;
SHOW checkpoint_completion_target;

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1.43K views06:07

SQL Portal | Базы Данных

Познакомьтесь с Postgresus — open-source и self-hosted решением для автоматизации бэкапов PostgreSQL.

Инструмент закрывает типичный набор задач, которые обычно размазываются по cron-скриптам и ручной поддержке.

Возможности:

- простое планирование резервного копирования;
- выгрузка в облачные хранилища (S3, R2, Google Drive);
- уведомления в Slack и Telegram.

Работа с бэкапами PostgreSQL часто превращается в набор разрозненных скриптов, где нужно отдельно держать расписание, ретраи, доставку в хранилища и алерты. Postgresus собирает это в единый воркфлоу с самохостингом и автоматизацией.

Подходит для DevOps-сценариев, где нужно централизовать резервное копирование без внешних SaaS-зависимостей.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

1.43K views12:00

SQL Portal | Базы Данных

Мониторинг реплик Postgres

Смотри pg_stat_replication на primary-ноде для отслеживания лага в реальном времени и состояния синхронизации. На standby используй pg_last_xact_replay_timestamp(), чтобы точно увидеть, когда был применён последний коммит.

Пример SQL-запросов для мониторинга.

Основная нода — состояние репликации

SELECT
    application_name,
    client_addr,
    state,
    sync_state,
    write_lag,
    flush_lag,
    replay_lag
FROM pg_stat_replication;

Основная нода — минимальная проверка подключённых реплик

SELECT *
FROM pg_stat_replication;

Резервная нода — время последнего применённого коммита

SELECT pg_last_xact_replay_timestamp();

Резервная нода — оценка отставания по времени

SELECT now() - pg_last_xact_replay_timestamp() AS replay_delay;

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

1.5K views06:07

SQL Portal | Базы Данных

Foreign Data Wrapper (FDW) в Postgres позволяют работать с удалёнными БД как с локальными таблицами. Поддерживаются FDW для других Postgres-баз, MongoDB, MySQL, ClickHouse и даже OGR spatial-файлов. Один запрос, несколько источников — без ETL.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

1.55K views16:07

SQL Portal | Базы Данных

В PostgreSQL есть LEAST и GREATEST для сравнения значений по колонкам — это не то же самое, что агрегационные MIN и MAX.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

1.7K views16:07

SQL Portal | Базы Данных

This media is not supported in your browser

VIEW IN TELEGRAM

Claude Code: достигнут лимит использования.

ожидание сброса лимита.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10🌚2

1.67K views06:07

SQL Portal | Базы Данных

Alexander_Benjamin_Bennett_50_Days_of_Data_Analysis_with_Python.pdf

50 дней DATA ANALYSIS с PYTHON

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥2

1.45K views16:07

SQL Portal | Базы Данных

Компания Zomato обрабатывает более 2 млн заказов в день.

450 млн сообщений в Kafka в минуту.
20 млрд событий обрабатывается в неделю.
Петабайты данных выполняются через запросы ежедневно.

Когда-нибудь задумывался, что происходит с данными твоего заказа ПОСЛЕ нажатия «Оформить заказ»?

Вот как реально выглядит data-пайплайн Zomato:

𝟭. 𝗧𝘆 𝗻𝗮𝘇𝗵𝗮𝗹 «𝗢𝗳𝗼𝗿𝗺𝗶𝘁𝘆 𝘇𝗮𝗸𝗮𝘇»
⤷ Заказ, оплата и геолокация попадают в Aurora MySQL + DynamoDB.
𝟮. 𝗦𝗼𝗯𝘆𝘁𝗶𝘆𝗮 𝗶𝗱𝘂𝘁 𝘃 𝗞𝗮𝗳𝗸𝗮
⤷ 450M+ сообщений в минуту.
⤷ Отсюда стартуют все downstream-пайплайны.
𝟯. 𝟰 𝗽𝗮𝗽𝗮𝗶𝗻𝗹𝗮𝗶𝗻𝗮 𝘇𝗮𝗽𝘂𝘀𝗸𝗮𝘆𝘂𝘁𝘀𝘆𝗮 (𝗻𝗲 𝟭, 𝗮 𝗰𝗵𝗲𝘁𝘆𝗿𝗲)
MySQL → Sqoop → S3 (пакетный ETL)
MySQL → Debezium CDC → Kafka → Flink → Iceberg (стриминг)
DynamoDB Streams → Spark → S3 (serverless-данные)
App Events → Kafka → Flink → Druid (реалтайм-дашборды)
𝟰. 𝗩𝘀𝗲 𝗽𝗮𝗱𝗮𝗲𝘁 𝘃 𝗦𝟯
⤷ Формат ORC. Таблицы Iceberg.
⤷ Вся система сходится в data lake.
𝟱. 𝗧𝗿𝗶𝗻𝗼 𝗼𝗯𝗿𝗮𝗯𝗮𝘁𝘆𝘃𝗮𝗲𝘁 𝗱𝗮𝘁𝗮𝗹𝗮𝗸𝗲
⤷ 250K+ запросов в неделю. 2 петабайта сканирования.
⤷ 3 типа кластеров: ad-hoc, ETL (через Airflow), отчётность.
⤷ JOIN’ы между MySQL, Druid, Pinot и MongoDB.
𝟲. 𝗗𝗿𝘂𝗶𝗱 𝗱𝗮𝗲𝘁 𝗿𝗲𝗮𝗹𝘁𝗮𝗶𝗺
⤷ 20 млрд событий в неделю. 8 млн запросов в неделю.
⤷ Время ответа — миллисекунды.
𝟳. 𝗞𝗼𝗺𝗮𝗻𝗱𝘆 𝘀𝗺𝗼𝘁𝗿𝘆𝗮𝘁 𝗱𝗮𝘀𝗵𝗯𝗼𝗮𝗿𝗱𝘆
⤷ Superset + Redash + Jupyter

𝗙𝘂𝗹𝗹 𝘀𝘁𝗲𝗸:
- Kafka (450M сообщений/мин)
- Flink, Spark, Sqoop на EMR
- Trino (batch) + Druid (real-time)
- S3 + Iceberg + ORC
- Debezium CDC
- Airflow
- Superset, Redash, Jupyter

В следующий раз, когда закажешь бирьяни в пятницу в 21:00…

заказ проходит через Kafka → Flink → S3 → Trino → дашборд.
в Zomato видят, что заказы бирьяни в Мумбаи выросли на 40%.
всё это почти в реальном времени. Это дата-инжиниринг на масштабе.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7

1.41K views06:07

SQL Portal | Базы Данных

Oracle Database 26ai расширила конструкцию возврата значений при операциях изменения данных.
Теперь при операциях изменения можно получить значения до и после изменения через OLD и NEW, включая поддержку MERGE.

Пример для UPDATE:

UPDATE ...
RETURN OLD col, NEW col
INTO :before, :after

Пример для MERGE:

MERGE INTO ...
RETURN OLD col, NEW col
INTO :before, :after

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

1.31K views16:07