Как реализуется механизм выбора лидера (Leader Election)?

Ответ

Выбор лидера (Leader Election) — это процесс в распределенных системах, в ходе которого один из узлов (нод) назначается «лидером», ответственным за координацию действий или выполнение уникальных задач.

Зачем это нужно?

Предотвращение Split-Brain: Гарантирует, что только один узел принимает решения.
Централизованная координация: Лидер может распределять задачи, управлять состоянием.
Единственный писатель (Single Writer): В некоторых архитектурах только лидеру разрешена запись данных для обеспечения консистентности.

Способы реализации

Использование распределенных систем координации (etcd, ZooKeeper, Consul)

Это самый надежный и распространенный подход. Узлы пытаются захватить распределенную блокировку (distributed lock). Тот, кто успешно это сделал, становится лидером. Блокировка обычно имеет время жизни (TTL) и привязана к сессии клиента. Если лидер «падает», его сессия истекает, блокировка освобождается, и другие узлы начинают новую борьбу за лидерство.

Пример с использованием etcd в Go:

import (
    "context"
    "log"
    "time"
    "go.etcd.io/etcd/clientv3"
    "go.etcd.io/etcd/clientv3/concurrency"
)

func main() {
    // 1. Подключаемся к etcd
    client, err := clientv3.New(clientv3.Config{
        Endpoints:   []string{"localhost:2379"},
        DialTimeout: 5 * time.Second,
    })
    if err != nil {
        log.Fatal(err)
    }
    defer client.Close()

    // 2. Создаем сессию, которая будет поддерживать keep-alive
    // Если сессия прервется, все блокировки, связанные с ней, освободятся
    session, err := concurrency.NewSession(client)
    if err != nil {
        log.Fatal(err)
    }
    defer session.Close()

    // 3. Создаем мьютекс для выборов по уникальному ключу
    electionMutex := concurrency.NewMutex(session, "/my-app/leader-election")

    // 4. Пытаемся захватить блокировку. Этот вызов блокирующий.
    ctx := context.Background()
    if err := electionMutex.Lock(ctx); err != nil {
        log.Fatal(err)
    }

    log.Println("Я стал лидером!")

    // ... выполняем лидерскую работу ...

    // 5. Освобождаем блокировку (например, при штатном завершении)
    defer electionMutex.Unlock(ctx)
}

На основе алгоритмов консенсуса (Raft, Paxos)

Более фундаментальный подход. Системы вроде etcd и Consul сами используют Raft «под капотом». Реализовывать такой алгоритм с нуля сложно, поэтому на практике почти всегда используют готовые решения.
Использование реляционных баз данных

Менее распространенный, но возможный способ. Узлы могут пытаться захватить блокировку на определенной строке в таблице с помощью SELECT ... FOR UPDATE.