Какие существуют подходы к балансировке нагрузки для gRPC-сервисов?

Question

Какие существуют подходы к балансировке нагрузки для gRPC-сервисов?

Тип вопроса: Сети Вероятность: 10% Категория: Golang Разработчик

Ответ

В gRPC балансировка нагрузки — это ключевой аспект, который отличается от традиционной HTTP/1.1 балансировки из-за долгоживущих HTTP/2 соединений. Существует два основных подхода:

1. Client-Side Load Balancing (Балансировка на стороне клиента)

Это наиболее распространенный и нативный для gRPC способ. Клиент сам знает о всех доступных экземплярах сервера и решает, на какой из них отправить запрос.

Как это работает: Клиент использует resolver (например, DNS) для получения списка IP-адресов серверов. Затем, согласно выбранной политике балансировки, он направляет вызовы на один из этих адресов.
Пример кода:

conn, err := grpc.Dial(
    // "dns:///my-service" указывает на использование DNS-резолвера
    // для обнаружения эндпоинтов сервиса 'my-service'.
    "dns:///my-service", 
    // Устанавливаем политику балансировки по умолчанию. 
    // "round_robin" — одна из самых простых, отправляет запросы по кругу.
    grpc.WithDefaultServiceConfig(`{"loadBalancingPolicy":"round_robin"}`),
    grpc.WithInsecure(), // Для примера отключаем TLS
)

2. Proxy-Side Load Balancing (Балансировка через прокси)

Между клиентами и серверами ставится промежуточный прокси-сервер (L7-балансировщик), который понимает протокол gRPC (и HTTP/2).

Зачем это нужно: Традиционные L4-балансировщики (работающие на уровне TCP) неэффективны для gRPC. Они видят одно долгое TCP-соединение и могут направить весь трафик от одного клиента на один сервер, нарушая баланс.
Примеры прокси: Envoy, Nginx (с модулем gRPC), Linkerd, а также облачные решения, такие как AWS Application Load Balancer.

Ответ 18+ 🔞

Ну, слушай, смотри, тут такая хуйня с gRPC и балансировкой нагрузки. Это, блядь, не как в старые добрые времена с HTTP/1.1, где каждое соединение — разовое и можно тупо по кругу кидать. Тут эти ваши HTTP/2 соединения живут долго и счастливо, пока их кто-нибудь не прибьёт. И из-за этого вся классика жанра летит в пизду.

В общем, есть два главных подхода, чтобы не было так, что один сервер ебётся в истерике, а остальные в ус не дуют.

1. Балансировка на стороне клиента (Client-Side)

Это, можно сказать, родной, каноничный способ для gRPC. Суть проста до безобразия: клиент сам себе голова и сам решает, кого из серверов сегодня ебашить.

Как это работает, ёпта: Клиент спрашивает у какого-нибудь резолвера (например, у DNS): «Братан, где тут сервера твои?». Тот ему список IP-адресов суёт. А дальше клиент, как хитрая жопа, по выбранной им же политике решает, на какой адрес отправить следующий вызов. Всё, балансировщик больше не нужен, он сам себе балансировщик, сам себе режиссёр.
Вот смотри, как в коде это выглядит:

conn, err := grpc.Dial(
    // "dns:///my-service" — это типа «эй, DNS, дай мне все адреса для my-service».
    "dns:///my-service", 
    // А тут мы говорим: «И используй, сука, round_robin, чтобы по кругу их всех ебалашить».
    grpc.WithDefaultServiceConfig(`{"loadBalancingPolicy":"round_robin"}`),
    grpc.WithInsecure(), // Для простоты примера, без шифрования.
)

2. Балансировка через прокси (Proxy-Side)

А это для тех, кто не доверяет клиентам или у кого клиенты — распиздяи. Ставим между ними и серверами умного посредника — прокси-балансировщик уровня L7, который в теме, что такое gRPC и HTTP/2.

Зачем это, блядь, нужно? Да потому что старые тупые L4-балансировщики, которые работают на уровне TCP, для gRPC — полный пиздец. Они видят одно долгое TCP-соединение и думают: «О, один клиент — один сервер, всё чётко». И весь трафик от одного юзера летит на одну бедную машину, а остальные в это время хуи считают. Непорядок.
Кто такие эти прокси? Ну, Envoy, Nginx (с нужным модулем), Linkerd. Ну или всякие облачные штуки типа AWS Application Load Balancer.

Ну и какие бывают стратегии, чтобы не было скучно?

round_robin: Классика жанра. По очереди, как в детском саду.
pick_first: «А похуй, первый попавшийся». Берёт первый рабочий сервер и долбит только его.
least_conn: Для умных. Выбирает того бедолагу, у кого сейчас меньше всего активных соединений, чтобы равномерно нагрузить.
weighted_round_robin: Для совсем хитрых. Тут у серверов есть «вес». Кому-то дают больше запросов, кому-то меньше. Типа справедливость, блядь.

Вот и вся магия. Главное — выбрать способ и не облажаться, а то будет как в той сказке: один сервер горит, а остальные пальцем в жопе ковыряют.