Что такое apply

«Что такое apply» — вопрос из категории Pandas, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

apply в Pandas — это универсальный метод для применения функции к данным вдоль оси (строки или столбцы). Он работает с Series и DataFrame, позволяя выполнять сложные операции, которые нельзя сделать стандартными методами.

Пример:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Применение функции к каждому элементу столбца
df['A_squared'] = df['A'].apply(lambda x: x ** 2)

# Применение функции к строкам
df['sum_row'] = df.apply(lambda row: row['A'] + row['B'], axis=1)

Нюансы:

  • axis=0 (по умолчанию) — применяет функцию к столбцам.
  • axis=1 — применяет к строкам.
  • Медленнее встроенных методов (например, sum()), но гибче.
  • Для оптимизации лучше использовать векторизованные операции или np.vectorize.