Как вы реализовывали масштабирование в вашем последнем проекте?

«Как вы реализовывали масштабирование в вашем последнем проекте?» — вопрос из категории Архитектура, который задают на 10% собеседований Java Разработчик. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Было применено горизонтальное масштабирование (scaling out) на основе Kubernetes.

Ключевые компоненты:

  1. Kubernetes HPA (Horizontal Pod Autoscaler): Автоматическое масштабирование количества подов на основе метрик CPU и памяти.
  2. Шардирование и репликация БД: Для stateful-сервисов использовалась PostgreSQL с разделением данных (шардированием) и репликацией для чтения.
  3. Кэширование: Redis для снижения нагрузки на базу данных.
  4. Балансировка нагрузки: Nginx Ingress Controller для распределения входящего трафика.

Пример конфигурации HPA:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-app
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70

Эта конфигурация поддерживает от 2 до 10 реплик приложения, увеличивая их число при загрузке CPU выше 70%.