Ответ
Я объясняю recall на конкретных, понятных бизнесу примерах, связывая его с рисками и деньгами.
Конкретный пример из моего опыта (обнаружение мошенничества в транзакциях): "Представьте, что в нашей платежной системе за месяц происходит 100 реальных мошеннических операций. Наша модель-детектор помечает 85 из них как подозрительные. В этом случае recall равен 85% (85 / 100). Это значит, что мы ловим 85% всех атак. Однако 15 мошеннических операций мы пропустили — это false negatives, и они принесут нам прямые финансовые потери."
Противопоставление с precision: "Recall отвечает на вопрос 'Сколько проблем мы НЕ пропустили?'. Precision же отвечает на вопрос 'Насколько мы точны, когда бьем тревогу?'. Высокий recall часто достигается ценой большего числа ложных срабатываний (false positives). В том же проекте с recall 85% precision был около 70%, то есть из 100 помеченных нами транзакций 70 действительно были мошенническими, а 30 — легальными операциями, которые мы ошибочно заблокировали, создав неудобство клиентам."
Когда важен высокий recall? Я подчеркиваю, что требовать максимум recall нужно в задачах, где пропуск положительного случая (false negative) критически дорог или опасен:
- Медицинская диагностика: Пропуск злокачественной опухоли.
- Безопасность: Пропуск реальной угрозы в системе видеонаблюдения.
- Поиск дефектов на производстве: Пропуск бракованной детали, которая может выйти из строя у потребителя.
Итог для бизнеса: "Выбор целевого значения recall — это всегда компромисс между риском пропустить проблему и затратами на обработку ложных тревог. Для нашей задачи по обнаружению мошенничества мы с продукт-менеджером договорились о recall не ниже 90%, потому что стоимость одной пропущенной мошеннической транзакции в среднем была в 10 раз выше, чем стоимость ручной проверки одной ложной тревоги."