Зачем нужна линеаризация ratio-метрики

«Зачем нужна линеаризация ratio-метрики» — вопрос из категории Статистика и проверка гипотез, который задают на 38% собеседований Продуктовый Аналитик. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Линеаризация ratio-метрики (например, CTR) преобразует её в линейную форму, чтобы можно было применять стандартные статистические методы (t-тесты, линейные модели). Это особенно важно для A/B-тестов, так как дисперсия ratio-метрик зависит от среднего, что нарушает предположения многих тестов.

Пример с CTR (клики/показы):

  1. Линеаризованная метрика: y = клики - CTR * показы
  2. Теперь можно сравнивать средние y между группами.
import numpy as np

# Исходные данные
clicks_A, views_A = 150, 1000
clicks_B, views_B = 170, 1000
ctr_pooled = (clicks_A + clicks_B) / (views_A + views_B)

# Линеаризация
y_A = clicks_A - ctr_pooled * views_A
y_B = clicks_B - ctr_pooled * views_B

Преимущества:

  • Стабилизирует дисперсию
  • Позволяет использовать стандартные тесты
  • Упрощает анализ при наличии ковариат