Как мы обеспечили +33% к точности на сложных SQL-запросах
Сгенерировать SQL с помощью LLM — не проблема. Сделать так, чтобы он работал правильно и стабильно — уже вызов: модели путаются в диалектах, ломаются на сложных схемах и не понимают контекст.
Мы пошли нестандартным путем — обучили SQL-генератор не на синтетике, а на реальных PostgreSQL-базах с помощью обучения с подкреплением. Вместо подгона ответов под эталон, модель училась писать запросы, которые реально выполняются правильно.
Использовали GSPO (Group Sequence Policy Optimization) — вариант PPO, который оценивает качество не отдельных токенов, а всей последовательности. Модель Qwen3-0.6B дообучали три дня на двух собственных датасетах, где остались только корректно исполняемые SQL.
Получили +11% к точности выполнения (EX) и особенно сильный рост на сложных задачах: +33% в категории challenging.
Результаты в карточках, статью целиком читайте на Хабре.
Сгенерировать SQL с помощью LLM — не проблема. Сделать так, чтобы он работал правильно и стабильно — уже вызов: модели путаются в диалектах, ломаются на сложных схемах и не понимают контекст.
Мы пошли нестандартным путем — обучили SQL-генератор не на синтетике, а на реальных PostgreSQL-базах с помощью обучения с подкреплением. Вместо подгона ответов под эталон, модель училась писать запросы, которые реально выполняются правильно.
Использовали GSPO (Group Sequence Policy Optimization) — вариант PPO, который оценивает качество не отдельных токенов, а всей последовательности. Модель Qwen3-0.6B дообучали три дня на двух собственных датасетах, где остались только корректно исполняемые SQL.
Получили +11% к точности выполнения (EX) и особенно сильный рост на сложных задачах: +33% в категории challenging.
Результаты в карточках, статью целиком читайте на Хабре.
🔥7👍2 2
В экспертной зоне разработчики задавали вопросы о работе с БД, влиянии искусственного интеллекта на будущее работы с данными, перспективах развития PostgreSQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
highload.ru
Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем 2025
❤5👍4🔥3
Media is too big
VIEW IN TELEGRAM
Распаковка чееек 🙃
Что DevRel'у Саше Фатину говорит его новый термос? Нужна ли отдельная ручка для записи гениальных идей? Из чего сделана несносная сумка?
➡️ Рассказали и показали в обзоре новеньких welcome-боксов.
Также внутри вас ждет секретный бонус. Какой? Приходите к нам в команду и сами все узнаете, мы запасли много таких — хватит на всех.
Что DevRel'у Саше Фатину говорит его новый термос? Нужна ли отдельная ручка для записи гениальных идей? Из чего сделана несносная сумка?
Также внутри вас ждет секретный бонус. Какой? Приходите к нам в команду и сами все узнаете, мы запасли много таких — хватит на всех.
Please open Telegram to view this post
VIEW IN TELEGRAM
😍14👍7🔥7 5
Профессия программист Си: плюсы, минусы и нужен ли свитер
Язык Cи жив, потому что это язык контроля и доверия: он дает власть над ресурсами, стабильность и предсказуемость. И вообще: низкоуровневые языки подходят тем, кто думает о высоком.
В новой статье Максим Орлов, программист Postgres Professional с 22-летним стажем, объясняет:
✔️ Зачем инженерам Cи?
✔️ Какие у языка сильные стороны и главные неудобства?
✔️ Как начать писать на Cи, если вам нравится низкоуровневое мышление?
В качестве пруфа, что язык 70-х годов все еще нужен, автор рекомендует книгу «QNX/UNIX: анатомия параллелизма», которой 25 лет, но она до сих пор актуальна. Торопиться нужно тем, кто опаздывает, а Си развивается не спеша, потому что вышел вовремя.
Мы любим Си. На нем написаны Postgres Pro Standard, Enterprise, Shardman, их сертифицированные версии и pg_probackup версий 2.х. Преимущественно на Си будет и наш Postgres Pro AXE.
Подробности ищите в карточках, статью читайте на Хабре.
Язык Cи жив, потому что это язык контроля и доверия: он дает власть над ресурсами, стабильность и предсказуемость. И вообще: низкоуровневые языки подходят тем, кто думает о высоком.
В новой статье Максим Орлов, программист Postgres Professional с 22-летним стажем, объясняет:
В качестве пруфа, что язык 70-х годов все еще нужен, автор рекомендует книгу «QNX/UNIX: анатомия параллелизма», которой 25 лет, но она до сих пор актуальна. Торопиться нужно тем, кто опаздывает, а Си развивается не спеша, потому что вышел вовремя.
Мы любим Си. На нем написаны Postgres Pro Standard, Enterprise, Shardman, их сертифицированные версии и pg_probackup версий 2.х. Преимущественно на Си будет и наш Postgres Pro AXE.
Подробности ищите в карточках, статью читайте на Хабре.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤6 3
Postgres Professional проводит во Владивостоке PGMeetup.VLD 2025 — рассказываем, что посмотреть в городе
Иркутск далеко от Москвы, но рядом с Байкалом. Торжок далеко от Краснодара, но рядом с Тверью. Владивосток особенный — он просто далеко.
Поэтому откуда бы вы ни прилетели на митап, скорее всего вы прилетели издалека. И неизвестно, когда снова побываете во Владивостоке.
Собрали 6 мест, которые стоит посетить.
Подробности — в карточках.
Координаты:
1. Мост с купюры 2000 ₽ — 43.0678, 131.9172
2. Конец Транссиба — 43.111161, 131.881550
3. Маяк Токаревского — 43.073160, 131.843145
4. Орлиное Гнездо — 43.121253, 131.897070
5. Подлодка С-56 — 43.113380, 131.891220
6. Мыс Тобизина — 42.945468, 131.870878
До встречи на митапе 4 декабря. Участие — бесплатное, регистрация — обязательная.
Иркутск далеко от Москвы, но рядом с Байкалом. Торжок далеко от Краснодара, но рядом с Тверью. Владивосток особенный — он просто далеко.
Поэтому откуда бы вы ни прилетели на митап, скорее всего вы прилетели издалека. И неизвестно, когда снова побываете во Владивостоке.
Собрали 6 мест, которые стоит посетить.
Подробности — в карточках.
Координаты:
1. Мост с купюры 2000 ₽ — 43.0678, 131.9172
2. Конец Транссиба — 43.111161, 131.881550
3. Маяк Токаревского — 43.073160, 131.843145
4. Орлиное Гнездо — 43.121253, 131.897070
5. Подлодка С-56 — 43.113380, 131.891220
6. Мыс Тобизина — 42.945468, 131.870878
До встречи на митапе 4 декабря. Участие — бесплатное, регистрация — обязательная.
❤10👍6🔥6 5
В крупных компаниях данных больше, чем понимания, что с ними делать. Они лежат в базах, логах и документах, а задача ML-инженера — превратить этот хаос в работающие модели и рост метрик.
Руководитель ML-отдела Postgres Professional Савелий Батурин рассказал о своей профессии:
✔️ Где проходит граница между ML и ИИ и как на самом деле думают языковые модели.
✔️ Как из запроса «сделайте нам ИИ» получить конкретную ML-задачу: к какому из пяти типов она относится и на какие три вопроса про задачу, бизнес-метрику и данные нужно ответить вначале.
✔️ Как в Postgres Professional подружили ИИ и PostgreSQL: LLM генерирует SQL, помогает с тюнингом запросов и опирается на базу данных, а не только на свои догадки.
✔️ Какие роли есть в ML и куда расти тем, кто хочет работать с моделями и не бояться восстания машин.
В телеграм-канале Postgres Professional рассказывали про наш ML-отдел, его разработки и руководителя.
Главное в карточках, статья целиком — на Хабре.
Руководитель ML-отдела Postgres Professional Савелий Батурин рассказал о своей профессии:
В телеграм-канале Postgres Professional рассказывали про наш ML-отдел, его разработки и руководителя.
Главное в карточках, статья целиком — на Хабре.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8 4👏3❤2