Ответ
Я инженер данных с опытом работы около 3 лет. Начинал как стажёр, изучая архитектуру DWH на MS SQL Server, а затем перешёл на полноценную позицию, где углубился в работу с распределёнными системами, такими как Greenplum и Hadoop.
Мой технический бэкграунд включает:
- Языки программирования: Основной рабочий язык — Python (для ETL, скриптов и Airflow). Также имею опыт с PHP и C++.
- Data Engineering стек: Apache Airflow, dbt, SQL (глубокое понимание производительности), различные СУБД (Greenplum, PostgreSQL, MS SQL Server).
Из наиболее значимых проектов я бы выделил:
- Полная миграция DWH с MS SQL Server на Greenplum. Я отвечал за перенос сложной бизнес-логики, ETL-процессов и оптимизацию производительности, что в итоге дало прирост скорости отчётов в несколько раз.
- Разработка и оптимизация CI/CD пайплайнов в GitLab для проектов данных, что сократило время сборки и развёртывания.
- Создание централизованных витрин данных для отдела аналитики, что стандартизировало метрики и сократило время на ad-hoc анализ.
Я ценю возможность работать над сложными задачами, которые имеют измеримый бизнес-эффект, и стремлюсь к постоянному развитию в области распределённых систем и архитектуры данных.