Приведи примеры использования ЦПТ в аналитике данных

«Приведи примеры использования ЦПТ в аналитике данных» — вопрос из категории Метрики и аналитика данных, который задают на 24% собеседований Бизнес Аналитик. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Центральная предельная теорема (ЦПТ) позволяет использовать нормальное распределение для анализа выборочных средних, даже если исходные данные не нормальны.

Примеры:

  1. A/B-тестирование – сравнение средних метрик (конверсия, средний чек) между группами. Даже если исходные распределения не нормальны, выборочные средние будут стремиться к нормальности.
  2. Прогнозирование спроса – оценка среднего спроса на товар по выборке заказов.
  3. Оценка качества – анализ среднего времени отклика сервера при нагрузочном тестировании.

Код (Python):

import numpy as np
import matplotlib.pyplot as plt

# Генерация не-нормальных данных (экспоненциальное распределение)
data = np.random.exponential(scale=1, size=1000)

# Применение ЦПТ: выборочные средние из 30 точек
sample_means = [np.mean(np.random.choice(data, 30)) for _ in range(1000)]

# Визуализация
plt.hist(sample_means, bins=30, density=True)
plt.title('Распределение выборочных средних (ЦПТ)')
plt.show()

Вывод: ЦПТ упрощает анализ, позволяя использовать методы, основанные на нормальности.