С какими данными работал

«С какими данными работал» — вопрос из категории Софт-скиллы, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый пример ответа, который можно адаптировать под свой опыт.

Ответ

Работал с разными типами данных: структурированными (SQL, CSV, Excel), полуструктурированными (JSON, XML) и неструктурированными (тексты, изображения). Основные источники:

  • Базы данных: PostgreSQL, MySQL, ClickHouse
  • Логи и API: парсил JSON-ответы, анализировал логи серверов
  • Веб-данные: парсил сайты (BeautifulSoup, Scrapy), работал с Google Analytics
  • Биллинг и транзакции: анализировал финансовые данные в Retail, E-commerce

Пример обработки JSON в Python:

import pandas as pd

data = {'user_id': [1, 2], 'purchases': [{'item': 'book', 'price': 10}, {'item': 'pen', 'price': 2}]}
df = pd.json_normalize(data, 'purchases', ['user_id'])