Расскажи про свое обучение

Question

Расскажи про свое обучение

Тип вопроса: Софт-скиллы Вероятность: 26% Категория: Data Scientist / ML Инженер

Ответ

Мой путь в Machine Learning начался с фундаментального изучения Python и базовых алгоритмов через курсы (Coursera, Stepik). Затем я углубился в необходимую математику: линейную алгебру, математический анализ и теорию вероятностей, так как без этого понимание моделей было бы поверхностным.

Практический опыт я нарабатывал на платформе Kaggle, где участвовал в соревнованиях по классификации и регрессии, что позволило глубоко изучить библиотеки scikit-learn, pandas, numpy и XGBoost/CatBoost. Например, я отработал пайплайны предобработки данных:

from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler, OneHotEncoder

numeric_transformer = Pipeline(steps=[
    ('imputer', SimpleImputer(strategy='median')),
    ('scaler', StandardScaler())
])

Следующим этапом стало изучение глубокого обучения (PyTorch) для задач NLP и Computer Vision. Сейчас я активно изучаю и применяю на практике подходы MLOps: использую DVC для версионирования данных и моделей, MLflow для трекинга экспериментов и FastAPI для развертывания сервисов. Для меня обучение — это непрерывный процесс: я регулярно читаю статьи на arXiv, пробую новые архитектуры в pet-проектах и изучаю инженерные аспекты поддержки ML-систем в production.

Ответ 18+ 🔞

Да ты посмотри, какой путь, ёпта! Ну, началось всё, как у всех — с этих ваших курсов. Сидел, блядь, на Coursera и Stepik, как дурак, Python ковырял и базовые алгоритмы. Думал, щас всё, я стану гением, а оказалось — это только начало, ебать мои старые костыли.

Потом дошло, что без математики — нихуя не понятно. Вообще. Сидишь, смотришь на формулу, а там одни закорючки. Пришлось, сука, вникать: линейная алгебра, матан, теория вероятностей. Без этого ведь понимание моделей — как хитрая жопа, снаружи вроде гладко, а внутри нихуя не разберёшь.

Ну, а теория без практики — это пизда рулю. Поэтому полез на Kaggle. Вот где, блядь, настоящая школа выживания! Там тебе и классификация, и регрессия, и овердохуища данных, которые надо чистить. Зато отточил scikit-learn, pandas, numpy и этих ваших XGBoost с CatBoost до блеска. Вот, смотри, как пайплайны собирал, чтобы не писать один и тот же код по сто раз:

from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler, OneHotEncoder

numeric_transformer = Pipeline(steps=[
    ('imputer', SimpleImputer(strategy='median')),
    ('scaler', StandardScaler())
])

Дальше — больше. Понял, что за классическим ML будущего нет, и врубился в глубокое обучение. PyTorch, блядь, взял в руки. NLP, Computer Vision — везде сунул свой нос. Сначала было волнение ебать, но потом втянулся.

А сейчас вообще мода пошла на эту вашу MLOps-хуйню. Без неё, оказывается, в продакшене нихуя не работает. Так что теперь я с DVC, как с родным, версионирую всё подряд, MLflow для экспериментов, а на FastAPI сервисы разворачиваю. Учиться, блядь, приходится постоянно: статьи на arXiv читаешь, в pet-проектах новые архитектуры пробуешь, чтобы не отстать от жизни. А то расслабишься — и всё, ты уже хуй с горы, а не специалист.