В чем преимущество медианы над средним арифметическим?

«В чем преимущество медианы над средним арифметическим?» — вопрос из категории Статистика и теория вероятностей, который задают на 26% собеседований Data Scientist / ML Инженер. Ниже — развёрнутый ответ с разбором ключевых моментов.

Тип вопроса: Статистика и теория вероятностей Вероятность: 26% Категория: Data Scientist / ML Инженер

Ответ

Ключевое преимущество медианы — робастность (устойчивость) к выбросам и асимметричным распределениям. Среднее арифметическое (mean) чувствительно ко всем значениям в выборке, в то время как медиана (median) зависит только от центрального значения в упорядоченном ряду.

Техническое объяснение:

Среднее: μ = (Σx_i) / n. Один экстремальный выброс значительно смещает результат.
Медиана: Значение, которое делит упорядоченную выборку пополам. Для его изменения нужно изменить множество центральных точек.

Пример на Python:

import numpy as np

# Данные с выбросом (например, зарплаты в компании)
salaries = [45000, 52000, 48000, 51000, 49000, 1200000]  # Выброс - 1.2M

mean_salary = np.mean(salaries)
median_salary = np.median(salaries)

print(f"Средняя зарплата: {mean_salary:.0f} руб.")  # Вывод: ~ 235833 руб.
print(f"Медианная зарплата: {median_salary:.0f} руб.")  # Вывод: 50500 руб.

В этом примере среднее (235 тыс.) не отражает типичную зарплату из-за одного выброса, тогда как медиана (50.5 тыс.) дает реалистичную оценку "центра" распределения.

Когда использовать медиану:

При работе с зашумленными данными или данными, содержащими выбросы (финансы, метрики производительности, геоданные).
Для описания "типичного" значения в сильно скошенных распределениях (логарифмически нормальных, Парето).
В качестве целевой метрики в задачах регрессии, где важна устойчивость (например, Median Absolute Error).

Видео-ответы

▶

Типичное собеседование #1. Позиция Junior Data Scientist. Accepted! Junior | Май 2022

Ответ

Видео-ответы

Похожие вопросы на собеседовании Data Scientist / ML Инженер

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки