Ответ
Load Average (LA) — это средняя нагрузка на систему, отражающая количество процессов в состоянии R (работающие) или D (ожидающие диска) за 1, 5 и 15 минут. Это ключевой метрика для понимания загруженности CPU и IO.
Основные команды:
# Краткий вывод с LA и временем работы
uptime
# Пример вывода: 15:32:45 up 30 days, 1:23, 1 user, load average: 0.85, 1.02, 0.95
# Прямое чтение из ядра
cat /proc/loadavg
# Вывод: 0.85 1.02 0.95 2/512 12345
# В мониторинге top/htop (первая строка)
top
Интерпретация: Значение LA нужно сравнивать с количеством доступных CPU-ядер. Узнать его можно так:
nproc # Количество логических ядер
grep -c ^processor /proc/cpuinfo
- LA <= nproc: Система справляется.
- LA > nproc: Формируется очередь процессов, возможны задержки.
- Высокий LA при низком %CPU: Часто указывает на проблемы с IO (диск/сеть), процессы заблокированы в состоянии D.
Для мониторинга в DevOps я интегрирую сбор LA (например, через Node Exporter) в Prometheus и настраиваю алерты на аномальный рост, особенно 15-минутного значения.