IT без паники

– Макс, мы тут совсем запутались, – вздохнул Ваня из соседнего отдела, аккуратно отодвигая от себя поднос с невкусным супом. – Наши джобы для рассылки подозрительных транзакций почему-то иногда пропускают часть результатов.
– Может ваши джобы подкуплены мошенниками? – ухмыльнулся Макс, пережёвывая салат с сомнительного вида курицей.
Ваня нахмурился:
– Ну серьёзно же. Каждые 10 минут запускаем выборку: выбираем всё, где время обнаружения (founded) больше, чем sysdate - 10/24/60 и рассылаем на почту. Должно работать как часы, а иногда некоторые строки в выборку не попадают!
Макс медленно кивнул:
– А вы считаете, что джобы у вас запускаются идеально ровно в каждые 10 минут?
– Ну думаю не совсем идеально...
– Вот именно, не совсем, – Макс чуть прищурился. – Поверь, ваш джоб далеко не единственный в базе, а планировщику выделяются ограниченные ресурсы. Он вполне может запуститься на несколько секунд позже. А в сбойных ситуациях, процесс вашего джоба вообще могут убить.
– Неужели все так плохо? у нас же база на очень мощном сервере.
– А вы верите, что базы и серверы живут в идеальном мире? Так вот, они живут в аду асинхронности, блокировок и подвисаний. Думаю, что ваша выборка теряет данные на границе интервала. - подытожил Макс.

– Что же делать? – Ваня выглядел обескураженно.
– Классика: заведи служебную таблицу, например, job_last_run, и пиши туда последнее значение founded, которое было отправлено. Следующий поиск выполняй от последнего сохранённого значения:

-- 1. читаем прошлое значение
SELECT last_founded FROM job_last_run WHERE job_name = 'fraud_monitor';

-- 2. заранее находим текущее максимальное
SELECT MAX(founded) INTO max_founded FROM fraud_alerts;

-- 3. делаем выборку
SELECT * FROM fraud_alerts WHERE founded > last_founded and founded <= max_founded;

-- 4. после рассылок обновляем крайнее значение
UPDATE job_last_run SET last_founded = max_founded WHERE job_name = 'fraud_monitor';

– Так вы точно не потеряете транзакции из-за сбоев запуска, – заключил Макс.
– А зачем второй пункт? Почему мы делаем SELECT MAX до выборки?
– Потому что между стартом выборки (п.3) и апдейтом (п.4.) в таблицу могут попасть новые записи, которые в следующем запуске будут потеряны. А вы кажется не хотите пропускать записи? - улыбнулся Макс.

– Выглядит просто и надежно. И почему мы раньше до этого не додумались? – Ваня выглядел одновременно радостным и раздражённым.
Макс философски посмотрел на свою подозрительную курицу и суп Вани:
– По той же причине, почему я каждый раз надеюсь, что в столовой будет вкусный обед: излишний оптимизм часто побеждает здравый смысл.

#кейс

👍9

144 viewsedited 04:28