Какую проблему решают Protocol Buffers (ProtoBuf) и в чем их ключевые преимущества?

Question

Какую проблему решают Protocol Buffers (ProtoBuf) и в чем их ключевые преимущества?

Тип вопроса: Архитектура Вероятность: 10% Категория: Golang Разработчик

Ответ

Protocol Buffers (ProtoBuf) — это разработанный Google механизм для эффективной и надежной сериализации структурированных данных. Он решает проблему обмена данными между сервисами, особенно в высоконагруженных системах, являясь более производительной альтернативой текстовым форматам вроде JSON и XML.

Ключевые преимущества:

Компактный бинарный формат: Сообщения в ProtoBuf занимают значительно меньше места, чем их эквиваленты в JSON, что снижает сетевой трафик и затраты на хранение.
Высокая скорость сериализации/десериализации: Парсинг бинарного формата требует меньше ресурсов CPU по сравнению с парсингом текста.
Строгая типизация и схема: Структура данных описывается в .proto файле, который служит контрактом между сервисами. Это позволяет выявлять ошибки несоответствия типов на этапе компиляции, а не в рантайме.
Кросс-языковая совместимость: Из одного .proto файла можно сгенерировать код для множества языков (Go, Java, Python, C++ и др.) с помощью компилятора protoc. Для Go используется генератор protoc-gen-go.
Обратная и прямая совместимость: Схему можно развивать (добавлять новые поля), не нарушая работу старых клиентов и серверов, которые просто проигнорируют неизвестные им поля.

Пример .proto файла:

// Указываем синтаксис
syntax = "proto3";

// Определяем пакет для Go
option go_package = "./user";

// Описание сообщения
message User {
  string name = 1;
  int32 id = 2;
  repeated string emails = 3;
}

Благодаря этим преимуществам, ProtoBuf является стандартом де-факто для фреймворка gRPC.

Ответ 18+ 🔞

А, вот эта штука, протокол буферы, протобуфы, блядь! Ну, это такая хуйня, которую Гугл придумал, чтобы данные между сервисами гонять, как угорелые, без этих ваших JSON'ов, которые раздуваются, как жопа после новогодних праздников.

Слушай, а главный прикол-то в чём? Всё по-взрослому, нахуй!

Почему это охуенно:

Места почти не ест. Всё в бинарнике, сжато, компактно. Не то что ваш JSON, где каждая скобочка и кавычка место жрёт. Тут всё туго, как барабан, блядь. Трафик экономится — деньги капают.
Летает, как ужаленный. Сериализовать и обратно развернуть — раз плюнуть. Процессор не пыхтит, как паровоз, парсинг текста не делает. Быстро, ёпта!
Схема, мать её. Ты сначала в файлике .proto описываешь, что и как. Типа контракт: «Вот, мужики, данные будут вот такой формы». И если ты потом в коде накосячил и строку в число суёшь — компилятор тебе ещё на этапе сборки по рукам настучит: «Куда лезешь, мудак? Тут тип не тот!». Не то что в JSON'е, где ошибка всплывет только когда всё уже ебнулось в рантайме.
На всех языках. Написал одну схему — и хуяк! — код для Go, Python, Java и ещё дохуя чего генерируется автоматом. Универсальная отмазка для всех в команде, блядь.
Не сломаешь старое. Можно схему допиливать, новые поля добавлять, а старые сервисы, которые про них не знают, просто проигнорируют и не сдохнут. Обратная совместимость — святое дело, ёбана!

Ну и, само собой, это основа для gRPC, без этого никуда. Стандарт де-факто, как есть.

Вот, смотри, как схему описывают, простой пример:

// Говорим, на какой версии синтаксиса варим
syntax = "proto3";

// Куда Go-код складывать будем
option go_package = "./user";

// А вот и наше сообщение, типа структура
message User {
  string name = 1;       // Поле имя, номер 1
  int32 id = 2;          // Поле айдишник, номер 2
  repeated string emails = 3; // А это список почт, номер 3. repeated — это типа массив, блядь.
}

Вот и вся магия. Описал структуру, сгенерировал код — и поехали данные летать быстро и без потерь. Удобно, чё.

Ответ

Ответ 18+ 🔞

Оформление подписки

Международная оплата

Оформление подписки