Какие знаешь меры центральных тенденций

«Какие знаешь меры центральных тенденций» — вопрос из категории Статистика и теория вероятностей, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Основные меры центральной тенденции:

  1. Среднее арифметическое — сумма всех значений, делённая на их количество. Чувствительно к выбросам.
    mean = sum(data) / len(data)
  1. Медиана — значение, разделяющее упорядоченный набор данных пополам. Устойчива к выбросам.
    median = sorted(data)[len(data) // 2]
  1. Мода — наиболее часто встречающееся значение в наборе данных. Может быть несколько мод или отсутствовать.

  2. Среднее геометрическое — корень n-й степени из произведения значений. Используется для мультипликативных данных.

  3. Среднее гармоническое — обратное к среднему арифметическому обратных значений. Полезно для скоростей и отношений.

Выбор меры зависит от распределения данных и наличия выбросов. Для нормального распределения подходит среднее, для асимметричного — медиана.