Расскажи о своих проектах — пример ответа на собеседовании Data Scientist / ML Инженер

Расскажи о своих проектах

«Расскажи о своих проектах» — вопрос из категории Софт-скиллы, который задают на 30% собеседований Data Scientist / ML Инженер. Ниже — развёрнутый пример ответа, который можно адаптировать под свой опыт.

Тип вопроса: Софт-скиллы Вероятность: 30% Категория: Data Scientist / ML Инженер

Ответ

Я работал над несколькими сквозными проектами, от исследования до внедрения. Вот два ключевых:

Система прогнозирования оттока клиентов для телеком-оператора
- Задача: Снизить churn rate (процент оттока) за счет раннего выявления клиентов с высокой вероятностью ухода.
- Мое участие: Собрал и проанализировал данные о транзакциях, тарифах и обращениях в поддержку. Провел feature engineering, создав признаки, такие как «средний чек за последний месяц» и «частота обращений».
- Решение: После сравнения нескольких алгоритмов выбрал LightGBM, так как он показал лучший баланс скорости и качества. Модель достигла AUC-ROC 0.89.
- Результат: Внедренный пайплайн еженедельно генерировал список «горячих» клиентов для отдела удержания. За первый квартал работы системы удалось снизить отток в целевой группе на ~7%.
Сервис автоматической модерации пользовательского контента (NLP)
- Задача: Автоматически фильтровать оскорбительные комментарии на платформе.
- Мое участие: Подготовил датасет (разметка + аугментация текстов). Обучил и сравнил модели на основе BERT (rubert-tiny) и классических методов (TF-IDF + LogisticRegression).
- Решение: Для баланса скорости/точности выбрали легкую модель на дистиллированном BERT. Разработал микросервис на FastAPI, который принимает текст и возвращает вероятность нарушения.
- Результат: Сервис обрабатывает ~1000 запросов в минуту с задержкой <50 мс. Точность (F1-score) на тестовой выборке составила 92%. Это позволило сократить нагрузку на ручных модераторов на 40%.