Ответ
Было применено горизонтальное масштабирование (scaling out) на основе Kubernetes.
Ключевые компоненты:
- Kubernetes HPA (Horizontal Pod Autoscaler): Автоматическое масштабирование количества подов на основе метрик CPU и памяти.
- Шардирование и репликация БД: Для stateful-сервисов использовалась PostgreSQL с разделением данных (шардированием) и репликацией для чтения.
- Кэширование: Redis для снижения нагрузки на базу данных.
- Балансировка нагрузки: Nginx Ingress Controller для распределения входящего трафика.
Пример конфигурации HPA:
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: my-app-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: my-app
minReplicas: 2
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 70
Эта конфигурация поддерживает от 2 до 10 реплик приложения, увеличивая их число при загрузке CPU выше 70%.