Acerca

Aleksandr Andreev

Lead Data Engineer con más de 9 años construyendo plataformas de streaming, analytics y lakehouse a escala de producción.

Trabajo en toda la superficie de una data platform: streaming pipelines, batch compute, table formats, orchestration, data quality y herramientas que ayudan a los equipos a moverse más rápido sin perder disciplina.

En los últimos años también he construido tooling interno de AI, especialmente sistemas de review y knowledge-assist basados en documentación real, no en prompts genéricos.

Este sitio es a la vez portfolio y laboratorio de escritura: ensayos, notas compactas y casos sobre sistemas interesantes por sus trade-offs.

Highlights

Construí y escalé data platforms para analytics y near real-time decisioning.

Trabajo práctico con Kafka, Flink, Spark, Airflow, dbt, Iceberg, Trino y Python.

Experiencia liderando delivery, mentoría y estándares de ingeniería.

Experiencia

Lead Data Engineer

AlfaStrakhovanie

2021 — presente

  • Lideré el diseño de real-time claims pipelines con Kafka, Flink e Iceberg para cargas de alto throughput.
  • Impulsé la migración de workloads analíticos hacia patrones lakehouse abiertos con Trino, dbt e Iceberg.
  • Construí un workflow de merge request review asistido por LLM adoptado por varios equipos.

Senior Data Engineer

Large financial services company

2018 — 2021

  • Construí y operé ETL pipelines basados en Spark sobre múltiples sistemas upstream.
  • Estandaricé patrones de orchestration en Airflow y mejoré la observability para data SLAs.
  • Mejoré performance de queries con mejores file layouts, partitioning y prácticas de columnar storage.

Data Engineer / Data Analyst

Earlier analytics and data roles

2015 — 2018

  • Pasé de analytics intensivo en SQL hacia Python y distributed data engineering.
  • Construí primeros event pipelines y aprendí cómo las decisiones de plataforma afectan a equipos downstream.

Skills seleccionadas

Streaming

Kafka, Kafka Streams, Flink

Batch

Spark, Airflow, dbt

Storage

Iceberg, Parquet, ClickHouse, PostgreSQL

Query

Trino, DuckDB, SQL optimization

Infra

Kubernetes, Docker, Terraform, GitLab CI

AI tooling

Claude API, RAG, Qdrant, internal dev-tools

Cómo trabajo

Prefiero infraestructura aburrida cuando escala operacionalmente.Hago explícitos los trade-offs en vez de esconderlos en diagramas.Construyo plataformas que los equipos pueden adoptar, no solo admirar.

Suscribirse

Recibe nuevos artículos por email cuando se publiquen. Sin spam: solo notas sobre data platforms, distributed systems y AI tooling.

Tu email se guarda solo para esta lista self-hosted.