Что будет с ROC-AUC, если все score модели уменьшить в два раза?

Question

Что будет с ROC-AUC, если все score модели уменьшить в два раза?

Тип вопроса: Метрики и функции потерь Вероятность: 26% Категория: Data Scientist / ML Инженер

Ответ

ROC-AUC останется неизменным. Эта метрика инвариантна к монотонным преобразованиям оценок (scores), так как зависит исключительно от порядка ранжирования объектов, а не от их абсолютных значений. Умножение всех оценок на положительную константу не меняет их относительный порядок, следовательно, ROC-кривая и площадь под ней (AUC) не изменятся.

Почему это важно: На практике это означает, что ROC-AUC оценивает способность модели ранжировать положительные и отрицательные примеры, а не калибровку вероятностей.

Пример на Python:

from sklearn.metrics import roc_auc_score

y_true = [0, 1, 0, 1]
scores = [0.1, 0.4, 0.35, 0.8]
scores_half = [s / 2 for s in scores]  # [0.05, 0.2, 0.175, 0.4]

print(f'ROC-AUC исходный: {roc_auc_score(y_true, scores):.3f}')
print(f'ROC-AUC после деления: {roc_auc_score(y_true, scores_half):.3f}')
print(f'Метрики равны? {roc_auc_score(y_true, scores) == roc_auc_score(y_true, scores_half)}')
# Вывод:
# ROC-AUC исходный: 0.750
# ROC-AUC после деления: 0.750
# Метрики равны? True

Ответ 18+ 🔞

Да ты посмотри, какая интересная хуйня выходит! Сидишь ты, значит, ковыряешь эти свои скоры, думаешь: "А что будет, если я их все на два поделю? Или на десять умножу?" А оказывается, что ROC-AUC — это такой хитрая жопа, которой на абсолютные значения просто да похуй. Ей главное — порядок.

Представь себе: у тебя есть два чувака, один с скором 0.8 (положительный класс), другой с 0.1 (отрицательный). Модель говорит: "Первый круче". А теперь ты берёшь и делишь всё на два. Первый стал 0.4, второй — 0.05. Но что изменилось? Ничего! Первый всё равно круче второго. Порядок-то не поменялся! Вот и ROC-AUC, этот упрямый пидарас шерстяной, сидит и смотрит только на этот порядок. Кривая строится по тому, как хорошо модель отделяет "хороших" от "плохих", а не по тому, какие конкретно цифры она плюёт.

Почему это, блядь, важно: Да потому что эта метрика отвечает на один простой вопрос: "Моделька, ты умеешь ранжировать?" То есть если дать ей сто объектов, она положительные вверх списка закинет, а отрицательные — вниз? Вот за это ей и ставят баллы. А калибрована она или нет — это уже другая история, про которую ROC-AUC нихрена не знает и знать не хочет.

Смотри, как на питоне это выглядит, ёпта:

from sklearn.metrics import roc_auc_score

y_true = [0, 1, 0, 1]
scores = [0.1, 0.4, 0.35, 0.8]
scores_half = [s / 2 for s in scores]  # [0.05, 0.2, 0.175, 0.4]

print(f'ROC-AUC исходный: {roc_auc_score(y_true, scores):.3f}')
print(f'ROC-AUC после деления: {roc_auc_score(y_true, scores_half):.3f}')
print(f'Метрики равны? {roc_auc_score(y_true, scores) == roc_auc_score(y_true, scores_half)}')
# Вывод:
# ROC-AUC исходный: 0.750
# ROC-AUC после деления: 0.750
# Метрики равны? True

Видишь? Ни хуя себе! Цифры другие, а результат — один и тот же. ROC-AUC стоит себе, как хуй с горы, и не шелохнётся. Так что запомни: если тебе нужно оценить именно ранжирующую способность — это твой выбор. А если нужны точные, откалиброванные вероятности — это уже совсем другой ёперный театр.

Видео-ответы

▶

#1 Успешное собеседование Data Scientist | Оффер 350к Senior | Октябрь 2023

Ответ

Ответ 18+ 🔞

Видео-ответы

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки