Ответ
Работал с разными типами данных: структурированными (SQL, CSV, Excel), полуструктурированными (JSON, XML) и неструктурированными (тексты, изображения). Основные источники:
- Базы данных: PostgreSQL, MySQL, ClickHouse
- Логи и API: парсил JSON-ответы, анализировал логи серверов
- Веб-данные: парсил сайты (BeautifulSoup, Scrapy), работал с Google Analytics
- Биллинг и транзакции: анализировал финансовые данные в Retail, E-commerce
Пример обработки JSON в Python:
import pandas as pd
data = {'user_id': [1, 2], 'purchases': [{'item': 'book', 'price': 10}, {'item': 'pen', 'price': 2}]}
df = pd.json_normalize(data, 'purchases', ['user_id'])