По какому принципу расставляются ранги в тесте Манна-Уитни

«По какому принципу расставляются ранги в тесте Манна-Уитни» — вопрос из категории Статистика, который задают на 25% собеседований Продукт Менеджер. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Тест Манна-Уитни использует ранжирование для сравнения двух независимых выборок. Принцип ранжирования:

  1. Все значения из обеих выборок объединяются в один общий ряд
  2. Значения сортируются по возрастанию
  3. Каждому значению присваивается ранг - его порядковый номер в общем ряду
  4. Если встречаются одинаковые значения (связки), им присваивается средний ранг

Пример с кодом на Python:

from scipy.stats import rankdata

sample1 = [3, 5, 2]
sample2 = [4, 1, 6]
combined = sample1 + sample2  # [3, 5, 2, 4, 1, 6]
ranks = rankdata(combined)    # [3.0, 5.0, 2.0, 4.0, 1.0, 6.0]

После ранжирования вычисляются суммы рангов для каждой выборки, и на их основе определяется U-статистика. Чем больше разница между суммами рангов, тем значительнее различия между выборками.