Ответ
При поиске данных аналитик проверяет:
- Полноту — отсутствие пропусков в ключевых полях
- Консистентность — соответствие форматов и типов данных
- Аномалии — выбросы, некорректные значения (например, отрицательный возраст)
- Дубликаты — повторяющиеся записи
- Логику — соответствие бизнес-правилам (например, дата заказа ≤ даты доставки)
Пример проверки на пропуски в Pandas:
df.isnull().sum()
И поиска аномалий:
df[(df['age'] < 0) | (df['age'] > 120)]