PG_EXPECTO – Telegram

PG_EXPECTO

31 subscribers

68 photos

30 videos

127 links

Эксперименты по анализу и оптимизации производительности PostgreSQL.
📝Автор и ведущий: Сунгатуллин Ринат. 📨Telegram: @rinace
📧Email: kznalp@yandex.ru
⛩️Дзен: https://dzen.ru/kznalp
🗳️GitHub: https://github.com/pg-expecto/pg_expecto

Download Telegram

About

Blog

Apps

Platform

Отслеживание метрик и анализ отдельных инцидентов часто не дают полной картины работы СУБД. Интеграция двух мощных инструментов — pgpro_pwr, собирающего детальную статистику, и pg_expecto, анализирующего события ожидания, — создает качественно новый уровень контроля. Этот симбиоз превращает разрозненные данные в последовательные и понятные сценарии для проактивного управления, глубокой диагностики и интеллектуальной оптимизации PostgreSQL.
https://dzen.ru/a/aWDLmSgG2XcyJxt3

29 viewsedited 09:52

Please open Telegram to view this post

VIEW IN TELEGRAM

16:27

В эпоху, когда скорость и стабильность баз данных напрямую влияют на успех бизнеса, необходим инструмент, который предоставляет полную прозрачность и контроль. pg_expecto 5.0 — это комплексное open-source решение, созданное для глубокой диагностики и оптимизации PostgreSQL. Оно объединяет продвинутый статистический анализ, проактивный мониторинг и встроенное нагрузочное тестирование в единый фреймворк. Уникальность инструмента — в корреляции внутренней статистики СУБД с метриками операционной системы и возможностях интеграции с ИИ для интеллектуальной аналитики. Это делает pg_expecto не просто утилитой, а полноценной методологией для администраторов, разработчиков и инженеров, стремящихся к максимальной производительности своих систем.
https://dzen.ru/a/aWIZ0iyZBGwoA4py

22 views10:53

Часто задаваемые вопросы (FAQ) по проекту pg_expecto

1️⃣Общая информация

Что такое pg_expecto?
Это открытый комплекс для глубокого статистического анализа, нагрузочного тестирования и построения отчетов для PostgreSQL. Его цель — заменить интуитивную настройку на воспроизводимый, data-driven эксперимент.

В чем основная философия проекта?
pg_expecto — это не просто инструмент, а целостная методология. Он превращает анализ производительности из хаотичного поиска в структурированный процесс: Гипотеза → Эксперимент → Сбор данных → Анализ → Вывод.

На какой стадии развития находится проект?
Проект находится на ранней стадии активного развития. Об этом говорит небольшое, но заинтересованное сообщество (например, 14 звёзд на GitHub) и регулярная публикация новых статей и исследований.

2️⃣Технические особенности и применение

Какую проблему решает pg_expecto, чего не хватает pg_stat_statements?
pg_stat_statements показывает статистику, но не объясняет причин проблем. pg_expecto проводит корреляционный анализ, связывая события ожидания внутри СУБД (wait events) с метриками операционной системы (CPU, I/O из vmstat/iostat). Это позволяет найти корень проблемы: диск, память, блокировки или неоптимальный запрос.

Можно ли с помощью pg_expecto находить проблемные запросы?
Да, это одна из ключевых задач. Методология позволяет быстро определить SQL-запросы (queryid), вносящие наибольший вклад в деградацию производительности во время инцидента.

Что такое «проактивный мониторинг» в pg_expecto?
Система использует регрессионный анализ для вычисления трендов скорости работы и времени ожиданий. Она может создать инцидент «Деградация производительности» до того, как проблема станет критической, предупреждая администраторов о негативной тенденции.

Как проект использует нейросети (ИИ)?
pg_expecto может использовать LLM (например, DeepSeek) для семантического анализа предварительно собранных данных: для кластеризации и описания проблем или выявления паттернов в SQL-коде. Важное уточнение от автора: Нейросеть — это помощник для обработки информации, а не источник экспертизы. Её рекомендации всегда должны проверяться данными экспериментов, так как LLM могут давать убедительные, но ошибочные или противоречивые советы.

3️⃣Установка, развитие и сообщество

Где найти код и документацию?
· Исходный код и основная документация: репозиторий на GitHub.
· Дополнительные материалы: канал на Дзене.

Каковы планы по развитию?
Основные усилия направлены на:

1. Улучшение пользовательского опыта: упрощение установки и добавление понятных руководств.
2. Расширение аудитории: перевод документации на английский язык и участие в конференциях.
3. Накопление кейсов: главная задача — собрать больше реальных примеров использования от сообщества.

Что дает проект сообществу PostgreSQL?
Он предлагает новый подход к performance-инжинирингу, опровергая устаревшие догмы (например, правило «25% RAM для shared_buffers») через контролируемые эксперименты. Это шаг от «шаманства» к инженерной практике.

Как я могу помочь или принять участие?
· Протестируйте инструмент на своих задачах и поделитесь отзывом.🙏
· Расскажите о проекте в профессиональных кругах.
· Предложите улучшения для документации или кода через GitHub.

GitHub - pg-expecto/pg_expecto: Комплекс pg_expecto для статистического анализа производительности и нагрузочного тестирования…

Комплекс pg_expecto для статистического анализа производительности и нагрузочного тестирования СУБД PostgreSQL - pg-expecto/pg_expecto

26 views06:55

PG_EXPECTO pinned «Часто задаваемые вопросы (FAQ) по проекту pg_expecto 1️⃣Общая информация Что такое pg_expecto? Это открытый комплекс для глубокого статистического анализа, нагрузочного тестирования и построения отчетов для PostgreSQL. Его цель — заменить интуитивную настройку…»

06:56

Новый этап исследований: поиск оптимальных параметров управления памятью Linux для PostgreSQL

Завершился важный цикл экспериментов по влиянию параметров подсистемы ввода-вывода на производительность PostgreSQL. Ключевую роль в объективной оценке сыграл комплекс pg_expecto, который позволил не просто собрать сырые метрики, а провести их системный статистический анализ, выявить корреляции и значимость каждого параметра. На основании этих данных были сформулированы четкие рекомендации по анализу параметров инфраструктуры для оптимизации подсистемы ввода/вывода.

Теперь переходим к следующему, не менее важному фронту работ — исследование методики расчета и настройки параметров управления памятью в Linux (таких как vm.swappiness, vm.dirty_ratio, vm.overcommit_memory и других).
Цель — определить оптимальные значения этих параметров для различных рабочих нагрузок СУБД, чтобы минимизировать накладные расходы на управление памятью и максимально эффективно использовать ресурсы сервера.

21 viewsedited 04:45

Итог новогодних выходных ❄️☃️
https://dzen.ru/a/aWXgiV73hWNCxIgW

Дзен | Статьи

Использование PG_EXPECTO для тонкой настройки IO Linux и повышения производительности PostgreSQL

Статья автора «Postgres DBA» в Дзене ✍: Производительность подсистемы ввода-вывода (IO) — критический фактор для любых высоконагруженных приложений, особенно для СУБД.

20 views07:34

Настройка параметров памяти и ядра — критически важный этап развёртывания PostgreSQL в продуктивной среде. Неправильные значения могут привести не только к снижению производительности, но и к невозможности запуска СУБД или аварийным завершениям под нагрузкой. В этом материале систематизированы параметры от критически важных до оптимизационных, а также приведена методика расчёта ключевых настроек PostgreSQL.
https://dzen.ru/a/aWZX74G7oXzZiMIz

24 views15:47

📝План работ и экспериментов:
1️⃣Изменить сценарий INSERT : отказаться от массовой вставки, 1 транзакция = 1 insert.
2️⃣Продолжение экспериментов о влиянии изменений инфраструктуры на обработку кеша СУБД (shared_buffers).

21 views05:06

Нейросети стремительно входят в повседневную практику разработчиков и администраторов баз данных, обещая революцию в оптимизации и автоматизации. Но насколько можно доверять их рекомендациям в сложных, высоконагруженных системах? На основе актуальных экспериментов 2025-2026 годов мы разбираем, как ИИ меняет работу с PostgreSQL, где он действительно полезен, а где его «категоричные» советы приводят к падению производительности на сотни процентов. Это не статья о страхах, а руководство по эффективному и безопасному использованию нового инструментария.
https://dzen.ru/a/aWh4NtBUtEXvCn5n

21 views05:34

Статья посвящена результатам комплексного анализа производительности системы после внесения изменений в тестовые сценарии и настройки окружения в версии 5.1. Основное внимание уделено выявлению узких мест под нагрузкой, в особенности — критическим проблемам ввода-вывода (I/O), которые стали определяющим фактором ограничения производительности СУБД.
https://dzen.ru/a/aWjJq9NfDEv1sYPy

22 views12:05

Статья посвящена анализу производительности системы на основе PostgreSQL в условиях нагрузочного тестирования, для увеличенного значения shared_buffers = 4GB. Основное внимание уделено выявлению узких мест в подсистемах ввода-вывода (I/O) и памяти, а также их влиянию на общую производительность СУБД. Результаты анализа служат основой для формирования конкретных рекомендаций по оптимизации инфраструктуры и конфигурации базы данных.
https://dzen.ru/a/aWji0yeSdXr5h1o-

20 viewsedited 14:43

От дисковых ожиданий к кэшированию: как shared_buffers меняет игру.
Данный отчёт суммирует результаты сравнительного нагрузочного тестирования СУБД PostgreSQL с использованием комплекса pg_expecto 5.1. Целью экспериментов была объективная оценка влияния ключевого параметра памяти — shared_buffers — на производительность базы данных и метрики инфраструктуры, в первую очередь подсистемы ввода-вывода. Тестирование имитировало смешанную OLAP-нагрузку с преобладанием операций чтения на идентичных конфигурациях, где единственной переменной был размер буферного кэша (1 ГБ в первом эксперименте и 4 ГБ во втором).
https://dzen.ru/a/aWjqAGX1SViFFtPp

28 viewsedited 14:45

Настоящее исследование посвящено экспериментальной проверке общепринятой рекомендации по снижению параметра vm.swappiness для серверов PostgreSQL с "OLAP-нагрузкой". В ходе нагрузочного тестирования на синтетической рабочей нагрузке, имитирующей аналитические запросы, было оценено влияние значений vm.swappiness = 10 и vm.swappiness = 1 на производительность СУБД и инфраструктуры. Результаты выявили неожиданные закономерности, ставящие под сомнение универсальность данной рекомендации
https://dzen.ru/a/aWnOoP-X7waGvapc

21 viewsedited 10:16

Многие администраторы баз данных слепо доверяют рекомендациям нейросетей и популярным гайдам по настройке PostgreSQL. Однако реальные условия могут кардинально отличаться от теоретических. В этой статье мы разберем, почему vm.swappiness=1 может стать ошибкой, если не учесть узкие места системы
https://dzen.ru/a/aWsieexi4izqPgpg

22 views07:10

vm.dirty_expire_centisecs = 1000 (10 секунд):
Уменьшает максимальное время хранения "грязных" данных в 3 раза
Позволяет более равномерно распределить запись на диск
Снижает риск накопления большого объема данных для сброса
#postgresql
https://dzen.ru/a/aWtKIpJDW0oZ3FfZ

20 views13:00

Эксперимент проводился с целью проверки гипотезы о том, что уменьшение времени хранения «грязных» данных в памяти с 30 до 10 секунд позволит снизить нагрузку на подсистему ввода-вывода и улучшить отклик системы.
#postgresql
https://dzen.ru/a/aWt7Fsz1OHIAePWX

20 views13:02

Тема для исследований.
Если PostgreSQL планирует контрольную точку, а ОС уже активно сбрасывает "грязные" страницы на диск — возникает избыточная нагрузка. Исследуем гипотезу о том, что согласование интервалов очистки кеша ОС и СУБД ведёт к более предсказуемой и эффективной работе.
#postgresql
https://dzen.ru/a/aWx78rz9xAmTkImr

22 views06:50

Тема для исследований.
Настройка СУБД PostgreSQL не ограничивается её внутренними параметрами. Ключевым фактором является взаимодействие с операционной системой. В данном отчёте исследуется теоретическое влияние тонкого параметра ядра Linux — vm.vfs_cache_pressure — на эффективность работы PostgreSQL при OLTP, OLAP и смешанных нагрузках.
#postgresql
https://dzen.ru/a/aWx-05OfHlFsNBZM

25 views06:52

PG_EXPECTO 5.1: Влияние vm.dirty_expire_centisecs=3000/1000/2000 на производительность PostgreSQL.
В отчете представлены результаты серии экспериментов по оценке воздействия настройки кэша записи ядра Linux (vm.dirty_expire_centisecs) на производительность СУБД PostgreSQL и дискового массива /data в условиях аналитической (OLAP) нагрузки с преобладанием операций чтения.
#postgresql
https://dzen.ru/a/aWyxxn4qWAPqkmqr

22 views10:46

⚠️Теперь любое сравнение или бенчмарк должны в обязательном порядке содержать не только детальную конфигурацию СУБД (версия, размеры буферов, настройки памяти), но и полную информацию о ключевых параметрах операционной системы.⚠️ Без этого контекста результаты тестов теряют объективность и воспроизводимость, так как потенциально скрывают узкие места, обусловленные не СУБД, а её окружением.
#postgresql
https://dzen.ru/a/aW0aXo_lNXVRfObn

22 views18:01