Ответ
Тест Манна-Уитни использует ранжирование для сравнения двух независимых выборок. Принцип ранжирования:
- Все значения из обеих выборок объединяются в один общий ряд
- Значения сортируются по возрастанию
- Каждому значению присваивается ранг - его порядковый номер в общем ряду
- Если встречаются одинаковые значения (связки), им присваивается средний ранг
Пример с кодом на Python:
from scipy.stats import rankdata
sample1 = [3, 5, 2]
sample2 = [4, 1, 6]
combined = sample1 + sample2 # [3, 5, 2, 4, 1, 6]
ranks = rankdata(combined) # [3.0, 5.0, 2.0, 4.0, 1.0, 6.0]
После ранжирования вычисляются суммы рангов для каждой выборки, и на их основе определяется U-статистика. Чем больше разница между суммами рангов, тем значительнее различия между выборками.