На что бы вы опирались при выборе между метриками ME (Mean Error) и MSE (Mean Squared Error)?

Question

На что бы вы опирались при выборе между метриками ME (Mean Error) и MSE (Mean Squared Error)?

Тип вопроса: Метрики и функции потерь Вероятность: 26% Категория: Data Scientist / ML Инженер

Ответ

Выбор между ME (средняя ошибка) и MSE (среднеквадратичная ошибка) зависит от целей анализа ошибок модели регрессии.

Сравнение метрик:	Критерий	ME (Mean Error)
Формула	`mean(y_pred - y_true)`	`mean((y_true - y_pred)^2)`
Чувствительность к знаку	Сохраняет знак, положительные и отрицательные ошибки компенсируют друг друга.	Игнорирует знак, все ошибки положительные.
Чувствительность к выбросам	Низкая. Один большой выброс мало повлияет на среднее.	Высокая. Квадрат сильно увеличивает вклад больших ошибок.
Интерпретация	Показывает систематическое смещение (bias) модели. ME ≈ 0 не означает отсутствие ошибок.	Показывает среднюю величину квадратов ошибок. Не имеет той же размерности, что и целевая переменная.

Практический пример и выбор:

import numpy as np
from sklearn.metrics import mean_squared_error

y_true = [100, 150, 200, 250, 300]
y_pred = [105, 145, 195, 260, 290] # Модель слегка завышает и занижает предсказания

me = np.mean(np.array(y_pred) - np.array(y_true))
mse = mean_squared_error(y_true, y_pred)

print(f"ME: {me:.2f}")   # Вывод: ME: -1.00 (небольшое систематическое занижение)
print(f"MSE: {mse:.2f}") # Вывод: MSE: 51.00

Выбрал бы MSE, если задача — минимизировать крупные ошибки, которые критически нежелательны (например, ошибка в прогнозе спроса на 1000 единиц хуже, чем десять ошибок по 100). MSE — стандартная дифференцируемая функция потерь для обучения моделей.
ME (или чаще MAE — Mean Absolute Error) использовал бы для анализа смещения модели или в задачах, где все ошибки одинаково важны, и выбросы не должны доминировать в оценке. Однако ME редко используется как основная метрика из-за свойства компенсации.

Ответ 18+ 🔞

Давай разберём эту дилемму, как будто выбираем между пивом и водкой в пятницу вечером. Тут два подхода к оценке ошибок модели, и каждый со своим характером, прямо как люди.

Кто есть кто:	Критерий	ME (Средняя ошибка)
Суть формулы	`mean(y_pred - y_true)`	`mean((y_true - y_pred)^2)`
Как относится к знакам	Сохраняет. Плюсы и минусы могут друг друга погасить, что иногда полная хуйня, если хочешь понять реальный разброс.	Наплевать. Все ошибки возводит в квадрат, так что становятся положительными.
Реакция на выбросы	Спокойная, как будто йог. Один дикий промах не особо испортит общую картину.	Истеричная, пиздец как. Один большой косяк, возведённый в квадрат, начинает доминировать в метрике, как пьяный дядя Вася на свадьбе.
Что показывает	Систематический уклон модели. Если ME около нуля — это не значит, что модель идеальна, просто она в среднем не завышает и не занижает. Может быть обманчиво.	Среднюю величину квадратов ошибок. Цифра получается не в тех же единицах, что и твои данные, что само по себе уже ёперный театр для интерпретации.

Пример из жизни, чтобы не быть голословным:

import numpy as np
from sklearn.metrics import mean_squared_error

# Допустим, предсказываем цены на квартиры, в тысячах долларов
y_true = [100, 150, 200, 250, 300]
y_pred = [105, 145, 195, 260, 290] # Модель где-то плюс-минус лапоть

me = np.mean(np.array(y_pred) - np.array(y_true))
mse = mean_squared_error(y_true, y_pred)

print(f"ME: {me:.2f}")   # ME: -1.00 (слегка в среднем занижает, но ерунда)
print(f"MSE: {mse:.2f}") # MSE: 51.00 (а вот эта цифра уже заставляет задуматься)

Выбрал бы MSE, если тебе критически важно не допускать херовых промахов. Ну, типа, ошибка в прогнозе нагрузки на сервер в 1000% хуже, чем десять ошибок по 10%. MSE на таких выбросах просто взвоет, и ты сразу поймёшь, что модель — говно. Это стандарт для обучения, потому что функция гладкая и удобная.
ME (или его более адекватный брат MAE) посмотрел бы, чтобы проверить, нет ли у модели дурной привычки постоянно врать в одну сторону. Но полагаться только на ME — это как верить пьяному другу, который говорит, что он трезвый: в среднем-то он прав, но по факту — манда с ушами. Ошибки друг друга скомпенсировали, а реального понимания, насколько всё плохо, ноль ебать.

Короче, если хочешь найти и наказать модель за крупные косяки — MSE твой друг, хоть и истеричка. Если хочешь понять, врет ли модель стабильно вверх или вниз — глянь на ME, но не делай из него культа. А лучше смотри на обе метрики, чтобы картина была полной, а не кривой, как хуй с горы.

Ответ

Ответ 18+ 🔞

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки