Какой смысл формулы t-теста

«Какой смысл формулы t-теста» — вопрос из категории Статистика и теория вероятностей, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

T-тест используется для проверки гипотезы о равенстве средних двух выборок. Основная идея — сравнить разницу между средними с учетом их вариативности. Формула t-статистики:

t = (X̄₁ - X̄₂) / √(s²₁/n₁ + s²₂/n₂)

Где:

  • X̄₁, X̄₂ — средние выборок,
  • s²₁, s²₂ — их дисперсии,
  • n₁, n₂ — размеры выборок.

Пример в Python:

from scipy.stats import ttest_ind
import numpy as np

sample1 = np.random.normal(10, 2, 100)
sample2 = np.random.normal(12, 2, 100)
t_stat, p_value = ttest_ind(sample1, sample2)

Чем больше t-статистика по модулю, тем значимее разница. P-value показывает вероятность получить такие данные при верной нулевой гипотезе (равенстве средних).