Java for Beginner

Protocol Buffers: сердце gRPC

Если gRPC — это двигатель взаимодействия сервисов, то Protocol Buffers (protobuf) — это его сердце.
Именно protobuf определяет, как описываются данные, как они сериализуются, и как из одной схемы генерируются типобезопасные классы для разных языков.

Чтобы по-настоящему понимать gRPC, нужно уверенно работать с .proto-файлами.

1. Что такое .proto файл

.proto — это файл описания структуры данных и интерфейсов (API).

Он играет сразу три роли:
Документирует контракт между клиентом и сервером (описывает, какие методы и какие данные доступны).
Генерирует код для разных языков с помощью protoc (компилятора Protocol Buffers).
Определяет схему сериализации — то, как объекты превращаются в байты и обратно.
Фактически .proto — это единый источник правды для вашего API.

2. Базовая структура .proto файла

Пример простого файла:

syntax = "proto3";

package car;

option java_multiple_files = true;
option java_package = "com.example.car";
option java_outer_classname = "CarProto";

// Определение сообщений
message Car {
  string model = 1;
  int32 year = 2;
  CarStatus status = 3;
}

// Перечисление (enum)
enum CarStatus {
  ACTIVE = 0;
  INACTIVE = 1;
}

// Определение сервиса
service CarService {
  rpc BuyCar (CarRequest) returns (CarResponse);
}

message CarRequest {
  string model = 1;
}

message CarResponse {
  string confirmation = 1;
}

3. Ключевые элементы .proto

3.1. syntax

Первая строка файла:

syntax = "proto3";

Обязательно указывает версию синтаксиса.
На практике используется только proto3, потому что она проще, строже типизирована и лучше поддерживается в gRPC.

3.2. package

Задает логическое пространство имён, чтобы избежать конфликтов:

package car;

В Java и других языках это превращается в пакеты/модули.

3.3. option

Позволяет задавать настройки генерации кода, например:

option java_package = "com.example.car";
option java_multiple_files = true;
option java_outer_classname = "CarProto";

Без этого весь код попадёт в один файл, что неудобно для больших схем.

3.4. message — описание структуры данных

message — это аналог класса в объектно-ориентированных языках.
Каждое поле внутри него — это свойство (переменная), которое сериализуется в бинарный поток.

Пример:

message User {
  string name = 1;
  int32 age = 2;
  repeated string hobbies = 3;
}


string name = 1; — поле с типом string и номером 1.

int32 age = 2; — целочисленное поле.

repeated string hobbies = 3; — массив строк.

Важно: номер поля (= 1, = 2, = 3) — это не просто индекс. Это ключ в бинарной сериализации, который должен быть уникален и неизменен.

3.5. enum — перечисление значений

enum — это список допустимых констант.

enum CarStatus {
  ACTIVE = 0;
  INACTIVE = 1;
  SOLD = 2;
}

Значение 0 обязательно — это значение по умолчанию.

При сериализации хранится не текстовое имя ("ACTIVE"), а его числовое значение (0), что делает protobuf компактным.

3.6. service — описание API

service определяет набор удалённых методов, которые сервер предоставляет клиенту.

Это аналог интерфейса в Java:

service CarService {
  rpc BuyCar (CarRequest) returns (CarResponse);
  rpc ListCars (Empty) returns (CarList);
}

Каждый rpc определяет:
имя метода (BuyCar),
входной тип (CarRequest),
выходной тип (CarResponse).

4. Типы данных в Protocol Buffers

Protobuf поддерживает ограниченный, но универсальный набор типов.

Некоторые часто используемые:

string - Текст
bool - Логическое значение
int32, int64 - Целые числа
float, double - Числа с плавающей точкой
bytes - Массив байтов
repeated - Массив
map<key, value> - Словарь

Пример:

message Garage {
  map<string, Car> cars = 1;
}

#Java #middle #gRPC #proto

👍2

63 views08:58

Java for Beginner

5. Нумерация полей — почему это критично

Каждое поле имеет свой уникальный номер — это его идентификатор в бинарном потоке.

message Car {
  string model = 1;
  int32 year = 2;
}

Если поменять номера, клиент и сервер перестанут понимать друг друга.
Например, если у старой версии клиента year = 2, а у новой year = 3, при сериализации они будут читать разные данные.

6. Почему важно резервировать поля

Когда вы удаляете или переименовываете поле, нельзя просто убрать строку — нужно зарезервировать номер и имя.

Пример:

message Car {
  string model = 1;
  reserved 2;             // резервируем номер
  reserved "status_old";  // резервируем имя
}

Это предотвращает случайное переиспользование старого номера под другое поле, что может привести к неправильной интерпретации данных.

7. Эволюция и миграция схем (Schema Evolution)

Protobuf специально спроектирован так, чтобы позволять обновлять схемы без поломки совместимости.
Главное — соблюдать несколько правил.

Что можно делать безопасно:
Добавлять новые поля с новыми номерами.
Удалять поля (с их резервированием).
Изменять имя поля (номер должен остаться прежним).
Изменять порядок полей — не влияет на сериализацию.

Что делать нельзя:
Менять тип поля (например, int32 → string).
Менять номер поля.
Удалять поле без reserved.

Пример миграции

Старая версия:

message User {
  string name = 1;
  int32 age = 2;
}

Новая версия:

message User {
  string name = 1;
  reserved 2;
  string email = 3;
}

Старый клиент, который не знает про email, просто проигнорирует это поле.
А новый клиент не столкнётся с конфликтом, потому что старый 2 зарезервирован.

8. Компиляция .proto файла и генерация кода

protoc — компилятор, который читает .proto и создаёт Java-классы.

Пример команды:

protoc \
  --java_out=./build/generated \
  --grpc-java_out=./build/generated \
  proto/car.proto

Результат:
Для каждого message создаются классы с Builder-паттерном.
Для service создаются классы CarServiceGrpc, CarServiceImplBase, CarServiceStub.

9. Пример полного цикла

Файл car.proto:

syntax = "proto3";

service CarService {
  rpc BuyCar (CarRequest) returns (CarResponse);
}

message CarRequest {
  string model = 1;
  int32 budget = 2;
}

message CarResponse {
  string message = 1;
}

Сгенерированный код в Java (упрощённо):

// Отправитель (клиент)
CarRequest request = CarRequest.newBuilder()
    .setModel("BMW")
    .setBudget(20000)
    .build();

CarResponse response = stub.buyCar(request);
System.out.println(response.getMessage());

Серверная реализация:

public class CarServiceImpl extends CarServiceGrpc.CarServiceImplBase {
    @Override
    public void buyCar(CarRequest request, StreamObserver<CarResponse> responseObserver) {
        String msg = "Car purchased: " + request.getModel();
        CarResponse response = CarResponse.newBuilder().setMessage(msg).build();

        responseObserver.onNext(response);
        responseObserver.onCompleted();
    }
}

#Java #middle #gRPC #proto

👍3

73 views08:58

Java for Beginner

Раздел 6. Коллекции в Java

Глава 5. Map — отображения (словари)

Основные методы: put - глубокое погружение в механизм добавления элементов

Метод put является фундаментальной операцией в интерфейсе Map, выполняющей добавление или обновление пар "ключ-значение". Несмотря на простоту вызова, внутри этой операции скрывается сложный механизм, варьирующийся в зависимости от конкретной реализации Map. Понимание внутренних процессов метода put позволяет разработчикам писать более эффективный код и избегать распространенных ошибок.

Общий алгоритм работы put

При вызове метода put(key, value) в любой реализации Map происходит последовательность взаимосвязанных процессов, которые можно разделить на несколько логических этапов.

Фаза предварительной обработки:
Валидация входных параметров (ключа и значения)
Вычисление хэш-кода ключа (для хэш-базированных реализаций)
Определение целевого местоположения элемента в структуре данных

Фаза поиска и разрешения коллизий:
Поиск существующего элемента с таким же ключом
Обработка коллизий (случаев, когда разные ключи претендуют на одно местоположение)
Принятие решения о добавлении нового элемента или обновлении существующего

Фаза модификации структуры:
Непосредственное добавление или обновление элемента
Балансировка и реструктуризация внутренней структуры данных
Проверка необходимости расширения емкости и выполнение resize операций

Детальный разбор для HashMap

Вычисление хэш-кода и определение индекса
В HashMap процесс начинается с вычисления хэш-кода ключа. Однако простое использование key.hashCode() недостаточно из-за потенциально плохого распределения хэш-кодов. Внутренний механизм применяет дополнительную хэш-функцию, которая "размешивает" биты хэш-кода, чтобы уменьшить количество коллизий. Этот процесс включает XOR старших и младших битов хэш-кода, что улучшает распределение даже для ключей с плохими хэш-функциями.

После вычисления улучшенного хэша определяется индекс бакета в массиве. Индекс вычисляется побитовой операцией AND между хэшем и размером массива минус один. Такой подход работает эффективно только когда размер массива является степенью двойки, что гарантирует равномерное распределение индексов.

Поиск в цепочке коллизий
Когда индекс определен, система проверяет целевой бакет.

Возможны три сценария:
Бакет пуст: Самый простой случай — создается новый узел и помещается в бакет. Операция практически мгновенна.
Бакет содержит один элемент: Происходит сравнение ключей. Если ключи идентичны (по equals), значение обновляется. Если ключи разные — возникает коллизия, и новый элемент добавляется в начало связного списка.
Бакет содержит несколько элементов: Начинается последовательный обход цепочки коллизий. Каждый элемент проверяется на соответствие ключа. Если совпадение найдено — значение обновляется. Если конец цепочки достигнут без нахождения совпадения — новый элемент добавляется в конец списка.

Преобразование в дерево (Java 8+)
В современных версиях Java при достижении цепочкой определенного порога (обычно 8 элементов) происходит преобразование связного списка в красно-черное дерево. Это значительно улучшает производительность поиска в длинных цепочках — с O(n) до O(log n).

Процесс преобразования включает:
Создание дерева из элементов цепочки
Балансировку дерева согласно правилам красно-черных деревьев
Поддержание свойств дерева для обеспечения эффективности операций

#Java #для_новичков #beginner #Map #put

👍1

18 views08:58

Java for Beginner

Механизм увеличения размера (resize)
Когда количество элементов превышает пороговое значение (емкость × коэффициент загрузки), запускается процесс resize.

Это одна из самых затратных операций в HashMap:
Создается новый массив бакетов большего размера (обычно в 2 раза)
Все существующие элементы перераспределяются по новому массиву
Для каждого элемента пересчитывается индекс на основе нового размера массива
При перераспределении цепочки коллизий могут разделяться между разными бакетами

Процесс resize особенно важен для производительности, так как неправильный выбор начальной емкости или коэффициента загрузки может привести к частым операциям resize.

Особенности LinkedHashMap

В LinkedHashMap процесс наследует всю сложность HashMap, но добавляет дополнительный слой — поддержание порядка элементов.

При добавлении каждого нового элемента:
Выполняются все стандартные операции HashMap
Новый элемент добавляется в конец двусвязного списка, поддерживающего порядок
Устанавливаются связи между новым элементом и предыдущим хвостом списка

При обновлении существующего элемента в режиме access-order элемент перемещается в конец списка, что требует:
Разрыва связей с соседними элементами в текущей позиции
Установки новых связей для включения элемента в конец списка
Обновления ссылок головы и хвоста списка при необходимости

Специфика TreeMap

В TreeMap процесс put кардинально отличается от хэш-базированных реализаций, так как основан на бинарном дереве поиска:
Поиск позиции для вставки: Начинается с корня дерева, и алгоритм рекурсивно спускается вниз, сравнивая новый ключ с ключами существующих узлов. Сравнение происходит либо через естественный порядок ключей (если они реализуют Comparable), либо через предоставленный Comparator.

Балансировка дерева: После добавления нового узла выполняется балансировка красно-черного дерева.

Этот процесс включает:
Перекрашивание узлов для соблюдения свойств красно-черного дерева
Выполнение вращений (left-rotate, right-rotate) для восстановления баланса
Обеспечение того, что путь от корня к любому листу содержит одинаковое количество черных узлов

Поддержание свойств дерева: Балансировка гарантирует, что дерево остается сбалансированным, обеспечивая логарифмическое время выполнения операций даже в худшем случае.

Обработка особых случаев

Работа с null ключами

Разные реализации Map по-разному обрабатывают null ключи:
HashMap: Разрешает один null ключ, который хранится в бакете с индексом 0
TreeMap: Не разрешает null ключи (выбрасывает NullPointerException), если только не предоставлен специальный компаратор, обрабатывающий null
ConcurrentHashMap: Не разрешает null ключи из-за ограничений многопоточности

Коллизии и равенство ключей
Процесс определения равенства ключей критически важен для работы put.

Он использует комбинацию:
Сравнения хэш-кодов (для быстрой предварительной проверки)
Проверки ссылочного равенства (==) для оптимизации
Вызова метода equals() для точного определения равенства

Разработчикам необходимо обеспечивать согласованность между hashCode() и equals() — если два объекта равны по equals(), их хэш-коды должны быть одинаковыми.

#Java #для_новичков #beginner #Map #put

👍1

16 views08:58

Java for Beginner

Влияние на производительность

Факторы, влияющие на скорость операции put
Качество хэш-функции: Плохая хэш-функция, создающая много коллизий, значительно замедляет операцию, увеличивая длину цепочек.
Коэффициент загрузки: Высокий коэффициент загрузки уменьшает частоту операций resize, но увеличивает среднюю длину цепочек коллизий.
Начальная емкость: Слишком маленькая начальная емкость приводит к частым операциям resize, слишком большая — к избыточному потреблению памяти.
Размер данных: В TreeMap производительность зависит от сбалансированности дерева, в HashMap — от равномерности распределения хэшей.

Сравнительная производительность
HashMap: O(1) в среднем случае, O(log n) в худшем (с деревьями)
LinkedHashMap: O(1) с небольшими накладными расходами на поддержание порядка
TreeMap: O(log n) в любом случае благодаря сбалансированному дереву

Потокобезопасность и параллелизм

В несинхронизированных реализациях Map операция put не является атомарной, что может привести к:
Потере данных при конкурентной модификации
Повреждению внутренней структуры данных
Бесконечным циклам в цепочках коллизий

ConcurrentHashMap решает эти проблемы через:
Сегментированную блокировку (в старых версиях)
CAS (Compare-And-Swap) операции и fine-grained блокировку (в новых версиях)
Позволяет выполнять конкурентные put операции на разных сегментах

Практические рекомендации

Оптимизация производительности

Для HashMap:
Выбирайте адекватную начальную емкость, чтобы избежать частых resize операций
Используйте ключи с хорошими хэш-функциями
Рассмотрите возможность использования immutable ключей

Для TreeMap:
Обеспечьте согласованность Comparator или естественного порядка
Используйте для данных, которые требуют сортировки или диапазонных запросов

Общие рекомендации:
Избегайте частых put операций в критичных по производительности участках кода
Используйте bulk операции при добавлении больших объемов данных
Рассмотрите альтернативные реализации для специфических use cases

#Java #для_новичков #beginner #Map #put

👍1

26 views08:58

About

Blog

Apps

Platform