Как связан размер выборки и величина стандарта ошибки среднего

«Как связан размер выборки и величина стандарта ошибки среднего» — вопрос из категории Статистика и теория вероятностей, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Стандартная ошибка среднего (SEM) показывает, насколько выборочное среднее может отклоняться от истинного среднего генеральной совокупности. Она рассчитывается как стандартное отклонение (σ) деленное на корень из размера выборки (n):

SEM = σ / √n

Чем больше выборка, тем меньше стандартная ошибка, так как √n растет быстрее, чем σ. Например, увеличение выборки в 4 раза уменьшит SEM вдвое.

Пример на Python:

import numpy as np

sample = np.random.normal(50, 10, 100)  # μ=50, σ=10, n=100
sem = np.std(sample, ddof=1) / np.sqrt(len(sample))
print(f"SEM: {sem:.2f}")  # Пример: SEM: 1.02

При n=400 SEM уменьшится примерно до 0.5. Однако зависимость нелинейная: для значимого снижения ошибки требуются экспоненциально большие выборки.