NEW BOT Телеграм, страница

⚡️Очередь задач на реляционной БД

Зачастую возникает необходимость в рамках приложения сделать очередь задач с такими вводными:

- Не очень высокая нагрузка (меньше 1000 задач в секунду)
- Не хочется тащить в проект Kafka, RabbitMQ, etc.
- Мы не хотим, чтобы задачу одновременно исполняли несколько потоков, нужен какой-то механизм синхронизации

Посмотрим на нашу модель данных:

create type task_status as enum ('NEW', 'COMPLETED', 'FAILED');

create table tasks
(
    id           bigserial   not null primary key,
    status       task_status not null,
    scheduled_ts timestamp   not null,

    body         jsonb       not null
);

Если просто делать

select * from tasks where status = 'NEW' and scheduled_ts < now()

То это приведет к ситуации, что одну и ту же задачу могут взять несколько воркеров.

Поэтому используем такой механизм как select for update. Он позволяет выбрать записи, удоволетворяющие условию и сразу их заблокировать до окончания текущей транзакции.

Итого цикл обработки одной задачи будет выглядеть так:

1) Открываем транзакцию
2) Достаем одну никем не заблокированную задачу, которая стоит первой в очереди:

select * from tasks
where status = 'NEW' 
and scheduled_ts < now()
order by scheduled_ts
limit 1
for update skip locked

3) Обрабатываем задачу
4) Выставляем нужный статус
5) Закрываем транзакцию

В приложении этот цикл фактически в while(true) { ... } параллельно исполняют несколько потоков, разгребая очередь.

При желании можно добавить счетчик попыток обработки задачи, чтобы сделать механизм reschedule-инга в случае неудачных попыток исполнения

👍20🔥7

2.9K viewsedited 15:58

Microservices Thoughts

🤔 Вопрос: Для чего используется паттерн Saga в микросервисной архитектуре?

Anonymous Quiz

1️⃣ Оптимизация производительности микросервисов

78%

2️⃣ Обработка распределенных транзакций между сервисами

12%

3️⃣ Обнаружение ошибок и откат действий между сервисами

4️⃣ Управление разрешениями и доступом к микросервисам

👍5❤2🔥2

609 voters3.08K views10:55

Microservices Thoughts

🤔 Вопрос: Что является основной идеей в архитектуре CQRS?

Anonymous Quiz

39%

1️⃣ Разделение отвественности за чтение и запись в одном классе

2️⃣ Объединение команд и запросов в один объект

49%

3️⃣ Отдельные модели для команд и запросов

4️⃣ Одна модель для команд и запросов

🔥5🤔3👍1

524 voters3.08K views22:13

Microservices Thoughts

⚡️Transactional Messaging

❓Проблема:

Хотим атомарно сделать изменение в БД и отправить событие об этом в очередь. Атомарность в данном случае означает, что событие успешно отправится тогда и только тогда, когда было успешно произведено изменение в БД.

Если делать так

begin;
<update statement>;
sendToQueue(event);
commit;

Возможна ситуация, что событие отправится, но транзакция в итоге откатится, например, из-за проблем с IO.

✅ Решение:

В транзакции, в которой происходит изменение в БД будем не отправлять эвент в очередь, а сохранять в базу. Таким образом, в силу атомарности транзакций нам уже СУБД гарантирует, что эвент сохранился <=> произошел апдейт.

И наконец, чтобы доставить сообщение до очереди можно использовать идею очереди на реляционной БД, которая была описана в предыдущем посте: https://news.1rj.ru/str/MicroservicesQuestions/5

Итоговая версия:

begin;
<update statement>
insert into tasks … # спустя какое-то время доставится до очереди
commit;

🔥9❤2

3.37K viewsedited 08:18

Microservices Thoughts

🤔 Вопрос: Что является верным утверждением на тему отличий Entity от Value object в DDD?

Anonymous Quiz

15%

1️⃣ Entity идентифицируется по своим аттрибутам, а Value object по уникальному идентификатору

66%

2️⃣ Value object идентифицируется по своим аттрибутам, а Entity по уникальному идентификатору

14%

3️⃣ Entity неизменяемы, а Value object изменяемы

4️⃣ Entity наследуются от Value object

👍4

487 voters3.5K views12:43

Microservices Thoughts

Какого контента больше хотелось бы?

Anonymous Poll

310 voters3.42K views20:23

Microservices Thoughts

⚡️OLTP vs OLAP

1️⃣ OLTP (Online Transactional Processing) - система обработки данных, при которой происходят частые короткие транзакции, преимущественно на запись.

- В качестве запросов используются простые insert, update, delete
- Время ответа: миллисекунды или меньше
- Объем БД обычно не очень большой
- Примеры СУБД: PostgreSQL, MongoDB, MySQL

2️⃣ OLAP (Online Analytical Processing) - система обработки данных, суть которой заключается в долгих читающих аналитических запросах.

- В качестве запросов используются сложные select запросы, обычно с join-ами, агрегациями и выборками большого числа строк
- Время ответа: до нескольких дней
- Объем БД может быть очень большим
- Примеры СУБД: Apache HBase, Clickhouse, Elasticsearch

👍9🔥1

4.17K viewsedited 22:37

Microservices Thoughts

Если кому-то интересна Kotlin разработка, то welcome на мой второй канал с аналогичным контентом, но уже по Kotlin 🙂

👍3

3.99K viewsedited 10:53

Microservices Thoughts

⚡️2PC (Two Phase Commit)

❓Проблема:

Есть несколько систем, у каждой своя база данных. Хотим сделать распределенную транзакцию, то есть действие, охватывающее все базы, которое либо применится во всех базах, либо не применится ни в одной.

✅ Решение:

Разделим нашу распределенную транзакцию на несколько этапов:

1. Просим все базы подготовить транзакции к коммиту. После этого этапа пока никаких изменений в базах не произошло.

❗️Важно, что СУБД должна поддерживать эту возможность, и что подготовка транзакции должна гарантировать успешный коммит в будущем.

2. Если одна из баз ответила, что не может подготовить транзакцию, то во все базы отправляем запросы на отмену транзакций. Если все базы ответили OK - шлем запросы на коммит транзакции во все базы.

❗️На втором этапе также могут быть проблемы: например, после коммита транзакции в первой базе, вторая база стала недоступна. Самым простым решением здесь будет пытаться ретраить запрос, но есть и другие политики обработки подобных ситуаций.

👍11🔥1

4.9K viewsedited 07:59

Microservices Thoughts

🤔 Вопрос: Что является верным утверждением на тему отличий L3 и L7 балансировки?

Anonymous Quiz

16%

1. Ширина канала, по которому передаются данные

2. Эффективность работы с мультимедийными файлами

63%

3. Уровень абстракции сетевого протокола

14%

4. Степень защищенности передаваемых данных

🔥3👍2

448 voters4.28K views04:08

Microservices Thoughts

🤔 Вопрос: Зачем нужны распределенные блокировки?

Anonymous Quiz

1. Для лимитирования числа запросов к API

74%

2. Для ограничения одновременного использования разделяемого ресурса распределенными узлами

11%

3. Для масштабирования количества обрабатываемых запросов

10%

4. Для упрощения межсервисного взаимодействия

👍6🔥3

600 voters4.67K views04:53

Microservices Thoughts

Какие темы статей были бы интересны?

Anonymous Poll

22%

Распределенные блокировки с помощью Redis

19%

Немного подробностей про L3 и L7 балансировку

55%

И то и другое

Обе темы неинтересны, напишу свой вариант в комментах

🔥3

366 voters5.14K views04:58

Microservices Thoughts

⚡️Почему большинство баз данных на самом деле не CP и не AP?

Крутая статья от Мартина Клеппмана (автор той самой книги с кабанчиком) на тему того, что на самом деле означают Consistency, Availability, Partition tolerance из CAP-теоремы, и почему большинство популярных БД удоволетворяют лишь Partition tolerance.

👍13🔥7🤔1🎉1🏆1

4.88K viewsedited 17:19

Microservices Thoughts

⚡Distributed Locking в Redis

❓Проблема:

Есть некоторый ресурс, для которого мы хотим обеспечить эксклюзивный доступ. При этом этот ресурс доступен в рамках нескольких процессов (например, ресурс - объект в БД, процессы - поднятые контейнеры микросевиса).

✅ Решение:

Используем Redis в качестве механизма синхронизации.

1. У нас один Redis мастер. В этом случае все просто:

1) Создаем запись, если таковая не существует по заданному ключу (NX) с таймаутом в 30000 миллисекунд (PX)

SET resource_name random_value NX PX 30000

2) Далее после использования ресурса удаляем лок, если он еще принадлежит нам - именно для этого используется random_value при блокировании.

if redis.call("get",KEYS[1]) == ARGV[1] then
    return redis.call("del",KEYS[1])
else
    return 0
end

2. У нас несколько Redis мастеров. Используем алгоритм Redlock, основная идея которого в следующем:

1) Получаем текущее время
2) Пытаемся сходить во все узлы и захватить там лок
3) Считаем время, которое потребовалось на захваты локов.
4) Если лок успешно захвачен на большинстве (n/2 + 1) узлов и время захвата меньше времени таймаута лока - то считаем, что лок успешно захвачен. В противном случае шлем запросы на разблокировку во все узлы.

❗️В обоих алгоритмах используется допущение, что вы гарантированно завершите работу с ресурсом за время истечения лока, иначе никаких гарантий эксклюзивности уже нет. Если это невозможно гарантировать, нужно использовать идею fencing token.

❗️Во втором алгоритме считается, что часы между узлами синхронизированы.

❗️Если локи нужны для обеспечения консистентности данных, то будьте очень осторожны с этими алгоритмами, в противном случае есть риск получать ситуацию, когда два потока одновременно используют ресурс.

👍10🔥10🌚2

5.2K viewsedited 13:46

Microservices Thoughts

⚡Идемпотентность API

❓Проблема:

Иногда возникает потребность, что несколько вызовов метода API должны иметь тот же эффект, что и один вызов. Например, чтобы в случае ретраев из-за сетевых проблем POST запрос не создавал снова ту же сущность.

✅ Решение:

Использование ключа идемпотентности, который будет выступать в роли идентификатора запроса, по которому мы сможем понять, что два запроса одинаковые.

❗️Существуют различные реализации механизма проверки, что запрос таким ключом уже обрабатывался. Но всегда стоит помнить, что наивная реализация check-then-act без каких-либо блокировок подвержена race-conditions (оба клиента почти одновременно проверили, что заданного ключа нет, и оба пошли исполнять запрос).

Имхо, наиболее простая реализация, когда хранилищем выступает реляционная БД с одним шардом, выглядит так:

Создадим таблицу для хранения уже обработанных ключей:

create table used_keys (
    value varchar(256) not null primary key
);

И теперь обработка нашего запроса выглядит примерно так:

begin transaction;
— проверка
insert into used_keys (value)
values ('some_key')
on conflict do nothing
returning *;
— если запрос ничего не вернул, значит уже обрабатывали
— если вернул, то обрабатываем запрос
commit;

insert … on conflict do nothing в рамках транзакции блокирует вставку с данным ключом, пока текущая транзакция либо не закомитится, либо не роллбекнется, что решает проблему с check-then-act: второй клиент просто будет ждать, пока первый успешно/неуспешно обработает запрос.

👍32🔥15🙏2

5.46K viewsedited 07:31

About

Blog

Apps

Platform