Ответ
Объем выборки зависит от нескольких факторов:
- Уровень значимости (α) - вероятность ложноположительного результата (обычно 5%).
- Мощность теста (1-β) - вероятность обнаружить эффект, если он есть (обычно 80-90%).
- Размер эффекта (MDE) - минимальный detectable effect, который мы хотим зафиксировать.
- Дисперсия метрики - чем выше вариативность, тем больше нужно данных.
Пример расчета в Python:
from statsmodels.stats.power import tt_ind_solve_power
# Параметры: эффект=0.05, α=0.05, мощность=0.8
sample_size = tt_ind_solve_power(effect_size=0.05, alpha=0.05, power=0.8)
print(f"Необходимый размер выборки: {round(sample_size)}")