Что проверяют статистические тесты?

Question

Что проверяют статистические тесты?

Тип вопроса: Статистика и теория вероятностей Вероятность: 26% Категория: Data Scientist / ML Инженер

Ответ

Статистические тесты используются для проверки гипотез о данных. Основные проверяемые аспекты:

Распределение данных: например, соответствует ли оно нормальному распределению (тест Шапиро-Уилка) или однородны ли дисперсии в группах (тест Левена).
Различия между группами или распределениями: например, различаются ли средние значения двух групп (t-тест) или несколько групп (ANOVA), либо различаются ли сами распределения (критерий Колмогорова-Смирнова).
Наличие зависимостей и связей: например, корреляция (Пирсона для линейной, Спирмена для монотонной) или ассоциация между категориальными переменными (критерий хи-квадрат).

Пример проверки нормальности в Python:

from scipy.stats import shapiro

# Пример выборки данных
data = [1.2, 1.5, 2.0, 2.1, 1.8]
stat, p_value = shapiro(data)
print(f"p-value: {p_value:.3f}")
# Если p-value > 0.05 (стандартный порог), нет оснований отвергнуть гипотезу о нормальности.

Ключевые принципы:

Выбор теста определяется типом данных (количественные/категориальные) и формулировкой исследовательской гипотезы.
Результат интерпретируется через p-value (вероятность получить наблюдаемые или более крайние результаты при условии истинности нулевой гипотезы).
Перед применением многих параметрических тестов (например, t-теста) необходимо проверить их предпосылки (нормальность, гомогенность дисперсий).

Ответ 18+ 🔞

Давай я тебе на пальцах объясню, что за зверь эти статистические тесты, а то в учебниках такое понапишут, что волосы дыбом.

Представь, у тебя есть данные. Куча циферок. И ты такой: «А что это за хуйня вообще?». Вот чтобы не гадать на кофейной гуще, умные дядьки придумали эти тесты. По сути, это инструменты, чтобы проверить свои догадки, они же гипотезы, на адекватность.

На что обычно смотрят, ёпта:

На то, как данные разбросаны. Ну, например, не пиздит ли мне кто, что всё красиво и симметрично, как колокольчик (нормальное распределение). Для этого есть, допустим, тест Шапиро-Уилка. Или вот: у меня три группы испытуемых, и я хочу понять, не охуели ли дисперсии в них по-разному (тест Левена). Если охуели, то уже одни методы не годятся, нужны другие.
На то, отличаются ли группы. Самый больной вопрос. Вот средняя зарплата у питонистов и джавистов. Одна больше другой или так, погрешность? Для двух групп — t-тест, для многих — ANOVA. А если мне похуй на средние, я хочу целиком распределения сравнить — тогда критeрий Колмогорова-Смирнова в дело.
На связи между штуками. Вот рост и вес — они вместе меняются или нет? Если связь прямая линия — корреляция Пирсона. Если просто «чем больше X, тем больше Y», но не обязательно по прямой — Спирмена. А если у тебя категории, типа «любит аниме» vs «играет в Dota», то тут хи-квадрат рулит, чтобы проверить, не связаны ли эти два признака.

Вот смотри, как это в коде выглядит, когда ты хочешь проверить, не кривое ли у тебя распределение:

from scipy.stats import shapiro

# Допустим, это твои данные, например, время отклика сервера
data = [1.2, 1.5, 2.0, 2.1, 1.8]
stat, p_value = shapiro(data)
print(f"p-value: {p_value:.3f}")
# Если p-value > 0.05 (стандартный порог), нет оснований отвергнуть гипотезу о нормальности.

Видишь? Получил p-value. Это, блядь, священная корова статистики. Грубо говоря, это вероятность, что твои данные выглядят так, как выглядят, если на самом деле никакого эффекта нет. Если эта вероятность совсем мизерная (обычно меньше 0.05), то твоя первоначальная догадка «ничего особенного нет» выглядит пиздец как неубедительно. Значит, что-то да есть.

Главные правила, без которых ты просто будешь тыкать пальцем в небо:

Сначала думай, потом тестируй. Какой тест брать — зависит от того, что у тебя за данные (цифры или категории) и что ты хочешь спросить. Нельзя тупо всё тыкать в t-тест, это моветон и путь в ад ложных открытий.
P-value — не бог, а индикатор. Он не говорит «это правда», он говорит «ваши данные выглядят странно, если считать, что ничего нет». Интерпретируй его с умом, а не как мантру.
Читай инструкцию к тесту! Многие крутые параметрические тесты (как тот же t-тест) требуют, чтобы данные были не абы какие. Например, чтобы распределения были нормальные, а разбросы в группах — примерно равные. Если эти предпосылки ебнулись, а ты всё равно применяешь тест — результат будет просто красивой, но абсолютно хуёвой картинкой. Доверия к такому результату — ноль ебать.

Короче, статистика — это не магия, а способ не обмануть самого себя. Но если применять её без мозгов, то можно наделать таких выводов, что сам потом от себя охуеешь.

Ответ

Ответ 18+ 🔞

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки