Обо мне

Александр Андреев

Lead Data Engineer с 9+ годами опыта в streaming, analytics и lakehouse-платформах.

Я работаю по всему стеку data platform: от streaming pipelines и batch compute до orchestration, table formats, data quality и внутренних инструментов, которые помогают командам двигаться быстрее.

Последние годы много внимания уделяю internal AI tooling, особенно review- и knowledge-assist системам, которые опираются на реальную документацию и процессы.

Этот сайт для меня одновременно портфолио и площадка для инженерного письма: статьи, короткие заметки и разборы систем, интересных не хайпом, а компромиссами.

Коротко

Проектировал и развивал data platforms для аналитики и near real-time сценариев.

Практический стек: Kafka, Flink, Spark, Airflow, dbt, Iceberg, Trino и Python.

Есть опыт delivery, менторства и повышения инженерной дисциплины в командах.

Опыт

Lead Data Engineer

AlfaStrakhovanie

2021 — настоящее время

Проектировал real-time pipelines для claims processing на Kafka, Flink и Iceberg.
Развивал lakehouse-подход для аналитических нагрузок на базе Trino, dbt и Iceberg.
Сделал LLM-assisted MR review workflow, которым пользуются несколько команд.

Senior Data Engineer

Крупная финтех/финансовая компания

2018 — 2021

Строил и сопровождал Spark-based ETL pipelines для нескольких upstream-систем.
Унифицировал orchestration-подходы в Airflow и улучшал observability для data SLA.
Ускорял аналитические запросы за счёт file layout, partitioning и columnar storage.

Data Engineer / Data Analyst

Ранние роли в аналитике и данных

2015 — 2018

Прошёл путь от SQL-heavy аналитики к Python и distributed data engineering.
Строил первые event pipelines и быстро понял цену плохих platform-решений.

Выборка навыков

Streaming

Kafka, Kafka Streams, Flink

Batch

Spark, Airflow, dbt

Storage

Iceberg, Parquet, ClickHouse, PostgreSQL

Query

Trino, DuckDB, SQL optimization

Infra

Kubernetes, Docker, Terraform, GitLab CI

AI tooling

Claude API, RAG, Qdrant, internal dev-tools

Как я работаю

Предпочитаю скучную инфраструктуру, если она лучше выдерживает эксплуатацию.Люблю явные trade-off'ы, а не красивые, но пустые архитектурные схемы.Стараюсь строить платформы, которыми команды реально пользуются.