Приведи пример P-value

«Приведи пример P-value» — вопрос из категории Статистика и теория вероятностей, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

P-value — это вероятность получить наблюдаемые или более экстремальные результаты при условии, что нулевая гипотеза верна. Чем меньше p-value, тем сильнее свидетельство против нулевой гипотезы. Обычно p-value < 0.05 считается статистически значимым.

Пример с кодом на Python (библиотека scipy):

from scipy import stats

# Предположим, у нас две выборки: A и B
sample_A = [25, 30, 35, 40, 45]
sample_B = [20, 22, 28, 32, 38]

# Проверяем, есть ли статистически значимая разница (t-тест)
t_stat, p_value = stats.ttest_ind(sample_A, sample_B)
print(f"P-value: {p_value:.4f}")  # Например, 0.1234

# Интерпретация:
if p_value < 0.05:
    print("Отвергаем нулевую гипотезу (различие значимо)")
else:
    print("Не отвергаем нулевую гипотезу")

В этом примере p-value показывает вероятность увидеть такие различия между выборками, если на самом деле они из одной генеральной совокупности.