Расскажи про свой опыт интеграции на прошлом проекте

Question

Расскажи про свой опыт интеграции на прошлом проекте

Тип вопроса: MLOps и деплой моделей Вероятность: 26% Категория: Data Scientist / ML Инженер

Ответ

На проекте по прогнозированию спроса я отвечал за интеграцию ML-модели в существующую ERP-систему на базе 1С. Моя задача заключалась в создании надежного сервиса, который бы получал данные из 1С, выполнял прогноз и возвращал результат обратно для планирования закупок.

Технический стек и реализация:

Бэкенд-сервис: Я разработал REST API на FastAPI, который инкапсулировал всю логику предобработки и инференса модели.
Взаимодействие с 1С: Для обмена данными использовался HTTP-протокол. Я написал адаптеры, которые преобразовывали входящие JSON-данные из 1С в формат, ожидаемый моделью, и обратно.

Пример эндпоинта:


from pydantic import BaseModel
from fastapi import FastAPI
import pickle

app = FastAPI() model = pickle.load(open('demand_model.pkl', 'rb'))

class PredictionRequest(BaseModel): item_id: int historical_sales: list[float] promo_flags: list[int]

@app.post("/api/v1/predict") def predict(request: PredictionRequest):

Препроцессинг входных данных

features = prepare_features(request)
# Прогноз
prediction = model.predict(features)
return {"item_id": request.item_id, "predicted_demand": prediction[0]}



**Решенные сложности:**
1.  **Производительность:** При пиковых нагрузках от 1С сервис мог не справляться. Я добавил кэширование повторяющихся запросов в Redis и асинхронную обработку с помощью `async/await` в FastAPI.
2.  **Надежность:** Чтобы обеспечить отказоустойчивость, настроил мониторинг (Prometheus + Grafana) для отслеживания latency и ошибок, а также реализовал механизм graceful degradation — если модель недоступна, сервис возвращает прогноз на основе простых эвристик.
3.  **Качество:** Для контроля дрифта данных и качества прогнозов в production был внедрен пайплайн, который периодически вычислял метрики (например, MAPE) на актуальных данных и логировал их в MLflow.

Ответ 18+ 🔞

А, ну это же классика, ёпта! Сидишь такой, в рот меня чих-пых, и думаешь: ну вот, прогнозирование спроса, машин лёрнинг, всё серьёзно. А потом бац — и тебе говорят: «А интегрируй-ка эту свою умную хуйню в нашу древнюю 1С, которая помнит ещё девяностые». Волнение ебать, сразу подозрение чувствую. Это как пытаться прикрутить реактивный двигатель к телеге.

Ну и как я это провернул, спросишь?

Сервис-то мой: Сваял я на FastAPI такой REST API, чтобы вся эта ML-магия была в одном месте. Чтоб 1С туда данные плюхнула, а оттуда же готовый прогноз получила. Чистая инкапсуляция, блядь.
Общение с монстром: С 1С общался по HTTP, как нормальные люди в XXI веке. Писал адаптеры, которые эту кашу из JSON, которую 1С выплёвывает, превращали во что-то, что моя модель не вырвет. И обратно, понятное дело.
Вот, смотри, как примерно выглядел главный эндпоинт:

from pydantic import BaseModel
from fastapi import FastAPI
import pickle

app = FastAPI()
model = pickle.load(open('demand_model.pkl', 'rb'))

class PredictionRequest(BaseModel):
    item_id: int
    historical_sales: list[float]
    promo_flags: list[int]

@app.post("/api/v1/predict")
def predict(request: PredictionRequest):
    # Препроцессинг входных данных
    features = prepare_features(request)
    # Прогноз
    prediction = model.predict(features)
    return {"item_id": request.item_id, "predicted_demand": prediction[0]}

А теперь про сложности, потому что нихуя просто не бывает:

Производительность, мать её. В какой-то момент 1С решала, что ей срочно надо прогноз на всё и сразу, и начинала слать запросы пачками. Сервис просто накрывался медным тазом. Пришлось выкручиваться: поставил Redis для кэша, чтобы одинаковые запросы не гонять по сто раз, и на FastAPI включил асинхронность (async/await). Стало летать.
Надёжность, блядь. Доверия к этой связке было ноль ебать. Поэтому навешал мониторинг — Prometheus с Grafana, чтобы видеть, не поломалось ли чего, и сколько времени отклик. И главное — сделал graceful degradation. Если моя модель вдруг сдохла или сервер упал, сервис не тупо молчал, а отдавал прогноз по какой-нибудь простой логике (типа «столько же, как в прошлом месяце»). Лучше хоть что-то, чем ничего, верно?
Качество, ёбана. А то вдруг модель на production'е обосрётся и начнёт нести хуйню? Подозрение ебать чувствую постоянно. Поэтому настроил пайплайн, который сам себя проверял: периодически брал свежие фактические продажи, сравнивал с тем, что нагадал, считал метрики вроде MAPE и всё это аккуратно в MLflow складывал. Чтобы не гадать, а знать, когда пора модель переучивать.

В общем, история про то, как заставить старую систему дружить с новой, не угробив при этом ни ту, ни другую. Получилось, вроде, неплохо.