Что такое агрегирующая функция agg в Python

«Что такое агрегирующая функция agg в Python» — вопрос из категории Python, который задают на 38% собеседований Продуктовый Аналитик. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Агрегирующая функция agg в Pandas позволяет применять одну или несколько агрегаций к DataFrame или Series. Она работает с методами группировки (groupby) или напрямую с объектами.

Пример:

import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6]
})

# Одна агрегация на столбец
df.agg({'A': 'sum', 'B': 'mean'})

# Несколько агрегаций на столбец
df.agg({'A': ['sum', 'min'], 'B': ['max', 'std']})

Ключевые особенности:

  • Поддерживает строковые имена функций ('sum', 'mean') или callable (np.sum).
  • Можно передавать словарь с разными агрегациями для каждого столбца.
  • Работает с groupby: df.groupby('col').agg({'other_col': 'sum'}).
  • Позволяет применять кастомные функции.