Ответ
Я Data Scientist с более чем пятилетним опытом в end-to-end разработке ML-решений. Мой основной стек — Python с фокусом на NLP и прогнозной аналитике. На последнем проекте в финтехе я построил пайплайн для классификации транзакций, который включал feature engineering на PySpark, обучение ансамбля моделей (CatBoost + LightGBM) и развертывание через FastAPI в Docker. Результатом стало снижение ложных срабатываний на 15% при сохранении высокого recall.
Мой технический стек:
- Основные библиотеки: Pandas, Scikit-learn, PyTorch (для кастомных NLP-моделей), XGBoost/CatBoost.
- Инфраструктура: SQL, Apache Airflow для оркестрации, MLflow для трекинга экспериментов, Docker.
- Области: Работал над задачами churn prediction, текстовой классификацией отзывов и оптимизацией рекомендательных систем.
Я ценю проекты, где ML-модель — это не просто прототип, а надежный компонент продукта, поэтому всегда уделяю внимание мониторингу, A/B-тестированию и воспроизводимости кода.