Можно ли t-тестом сравнить две выборки

«Можно ли t-тестом сравнить две выборки» — вопрос из категории Статистика и теория вероятностей, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Да, t-тест можно использовать для сравнения двух выборок, но важно учитывать условия его применения:

  1. Независимые выборки — если группы никак не связаны, используй двухвыборочный t-тест (independent samples t-test).
  2. Зависимые выборки — если данные парные (например, до/после), применяй парный t-тест (paired t-test).

Условия:

  • Данные должны быть нормально распределены (проверь Shapiro-Wilk или визуально через QQ-plot).
  • Для независимого t-теста — гомогенность дисперсий (тест Левена).

Пример кода (Python, scipy.stats):

from scipy import stats

# Независимые выборки
t_stat, p_value = stats.ttest_ind(group1, group2, equal_var=True)  # equal_var=False для Уэлча

# Парные выборки
t_stat, p_value = stats.ttest_rel(before, after)

Если условия не выполняются, используй непараметрические аналоги: Манна-Уитни (U-тест) или Вилкоксона.