Simulative

💥 А вы знакомы с оператором MERGE в PostgreSQL?

На одном из собеседований нашего студента спросили "что делает оператор MERGE?". И хотя это, прямо скажем, не первая по важности вещь для аналитика, все-таки может быть полезна.

🟣 Так что же такое MERGE?

MERGE - оператор, который заменяет сразу несколько других.

Представьте, что у вас есть таблица с инвентарем товаров, которые продает ваша компания. Время от времени вы получаете наборы данных либо с новыми продуктами, которые необходимо внести, либо списки товаров в наличии, которые могут иметь или не иметь расхождения с инвентарем.

Обычно такое обновление можно выполнить в стороннем приложении. Проблема только в перетаскивании данных туда-сюда, которые вероятно придется сделать несколько раз (из базы в приложение, и обратно), а это много дополнительных издержек (в данном случае времени).

🖋 Но с недавнего времени в этом нет необходимости, благодаря MERGE все можно легко сделать прямо в базе.

Для работы с MERGE нужны две таблицы. Таблица с обновлениями и основное хранилище данных - целевая таблица. Содержимое таблицы с обновлениями сравнивается с целевой, и в целевой таблице происходят изменения.

🔵 Как это работает?

Начнем с двух таблиц и одной строки данных.

create table a (id int, x int, status char(10));

create table b (id int, x int, status char(10));

insert into a (id, x, status) values (1, 1, 'From a');

select * from a;
select * from b;

id | x | status
---+---+------------
1  | 1 | From a
(1 row)

id | x | status
---+---+--------
(0 rows)

Теперь мы можем попробовать MERGE в запросе. Таблица a содержит одну строку, а в таблице b - строк вообще нет. И в запросе записи, не включенные в целевую таблицу, мы вставляем, а те, которые есть, обновляем:

MERGE into b using a on a.id = b.id
when matched then 
     update set x = b.x + 1
when not matched then 
     insert (id, x, status) values (a.id, a.x, a.status);

Запрос сообщает - сопоставь две таблицы по id. Если есть строки, которые совпадают, то столбец x в таблице b увеличь на единицу. Но если совпадений нет (совпадения не будет, так как таблица b пуста), то содержимое строки из таблицы a копируется в таблицу b. Если мы теперь посмотрим на обе таблицы, мы увидим, что они идентичны.

select * from a; 
select * from b;

 id | x |   status
----+---+------------
  1 | 1 | From a
(1 row)

 id | x |   status
----+---+------------
  1 | 1 | From a
(1 row)

🟢 А что если запустить MERGE снова?

Указанная в запросе логика будет выполнена, и значение столбца x увеличится с 1 до 2.

select * from a; 
select * from b;

id | x | status
---+---+------------
1  | 1 | From a
(1 row)

id | x | status
---+---+------------
1  | 2 | From a
(1 row)

И, каждый раз, когда мы перезапускаем запрос с MERGE - x будет увеличиваться.

🟡 Можем и удалить!

Мы можем не только обновлять (UPDATE) значения, но и удалять их. Например, давайте изменим наш запрос так, чтобы не увеличивать значение, а удалять строку в целевой таблице, если найдутся соответствующие строки.

merge into b using a on a.id = b.id
  when matched then delete
  when not matched then 
       insert (id, x, status) values (a.id, a.x, a.status);

select * from b;

 id | x | status
----+---+--------
(0 rows)

Примечание: операция MERGE доступна только в PostgreSQL 9.5 и более поздних версиях.

Теперь вы точно знаете, что ответить на собеседовании, и что MERGE чрезвычайно полезный инструмент. И даже эти очень простые примеры дают представление о его использовании. Во многих ситуациях ранее приходилось бы использовать множество дополнительных конструкций для такого обновления, а теперь достаточно знать один MERGE.

#sql #interview_problems

🔥18👍6

1.71K viewsedited 16:04