Какую модель потребления сообщений использует Kafka: Push или Pull?

Ответ

Kafka использует Pull-модель для потребления сообщений потребителями (consumer).

Почему Pull, а не Push?

  • Контроль скорости: Потребитель сам запрашивает данные, контролируя темп обработки и избегая перегрузки.
  • Пакетная обработка: Позволяет эффективно получать сообщения батчами.
  • Повторное чтение: Потребитель может откатиться к более раннему смещению (offset) для повторной обработки.

Пример кода потребителя (Java):

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("group.id", "test-group");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

try (KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props)) {
    consumer.subscribe(List.of("my-topic"));
    while (true) {
        // Потребитель явно запрашивает (pull) сообщения
        ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
        for (ConsumerRecord<String, String> record : records) {
            System.out.printf("offset = %d, key = %s, value = %s%n",
                record.offset(), record.key(), record.value());
        }
    }
}

Важный нюанс: Kafka использует гибридный подход:

  • Push от продюсера (producer) к брокеру.
  • Pull от брокера к потребителю (consumer).

Ответ 18+ 🔞

А, вот эта штука с Кафкой, да? Ну, слушай, тут история как в хорошем баре: не тебе наливают, когда бармену вздумается, а ты сам подходишь и говоришь — налей, сука, ещё!

Так вот, Кафка, она умная, блядь. Она не пихает тебе сообщения в глотку, как назойливая тёща пельмени. Это же Pull-модель, ёпта! Потребитель сам, как взрослый дядька, идёт и спрашивает: «А что там у вас новенького?».

А че не наоборот? Че не Push? Да потому что, блядь, представь: тебе в чат-бот начинают хуярить сообщения овердохуища, а ты их обрабатываешь со скоростью улитки на транквилизаторах. Тебя просто разорвёт, как грелку! А так — ты сам контролируешь, когда и сколько взять. Захотел — взял пачку, обработал, потом ещё. Никакого аврала, всё по кайфу.

И ещё фишка — пакетная обработка. Это как не бегать за каждой семечкой, а схватить горсть сразу. Эффективнее, ёбана! Ну и если накосячил — всегда можно отмотать назад, к старому оффсету, и перечитать. Красота!

Смотри, как код выглядит (Java):

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("group.id", "test-group");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

try (KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props)) {
    consumer.subscribe(List.of("my-topic"));
    while (true) {
        // Вот тут он явно ТЯНЕТ (pull) сообщения, сам!
        ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
        for (ConsumerRecord<String, String> record : records) {
            System.out.printf("offset = %d, key = %s, value = %s%n",
                record.offset(), record.key(), record.value());
        }
    }
}

Но, блядь, есть нюанс, как говорится! Кафка — она хитрая жопа. Гибридный подход использует.

  • От продюсера к брокеру — это Push. Продюсер принёс, сука, сдал и свободен.
  • А вот от брокера к потребителю — уже наш любимый Pull. Потребитель пришёл, когда готов, и забрал.

Вот так вот, не всё так однозначно, блядь. Но в целом — логично, как швейцарские часы, только без этой их ебучей точности до наносекунды.