Ответ
Load Average — это ключевая метрика для понимания нагрузки на систему. Три числа показывают среднее количество процессов, находящихся в состоянии R (runnable) или D (uninterruptible sleep), за последние 1, 5 и 15 минут соответственно.
- 5.00 — средняя нагрузка за последние 5 минут.
- 2.00 — средняя нагрузка за последнюю 1 минуту.
- 1.00 — средняя нагрузка за последние 15 минут.
Как я интерпретирую эти значения:
- Сравнение с количеством CPU-ядер: Это самый важный шаг. Узнаю количество ядер командой
nprocилиlscpu. Если Load Average стабильно превышает количество ядер, система перегружена, процессы ждут своей очереди. - Анализ тренда: Соотношение трех чисел показывает динамику. Например,
5.00, 2.00, 1.00означает, что нагрузка резко выросла в последние 5 минут (была 1.0, стала 5.0). Напротив,1.00, 2.00, 5.00говорит о том, что пиковая нагрузка была 15 минут назад и сейчас система восстанавливается. - Диагностика: Высокий Load Average при низком использовании CPU (
top,mpstat) часто указывает на проблемы с I/O (процессы в состоянии D). В таком случае смотрюiostatилиiotop.
Пример для 4-ядерного сервера:
Load Average: 4.00, 3.80, 3.50— система стабильно загружена на 100%.Load Average: 8.00, 4.00, 2.00— в последние 5 минут возникла серьезная перегрузка, вдвое превышающая возможности CPU.