Проект
Живой инженерный dashboardПубличный самообновляющийся dashboard, который собирает активность GitHub, heatmap контрибуций и метрики сайта в один data product.
2 мин чтения
Lead Data Engineer · 9+ лет
Строю streaming-, lakehouse- и applied-AI платформы в production-масштабе — Kafka, Flink, Spark, Iceberg, Trino и инструменты, которые держат их надёжными.
Проект
Живой инженерный dashboardПубличный самообновляющийся dashboard, который собирает активность GitHub, heatmap контрибуций и метрики сайта в один data product.
2 мин чтения
Статья
DuckDB httpfs pushdown для Parquet в S3DuckDB умеет проталкивать проекции колонок и фильтры прямо в чтение Parquet из S3 — но только если статистика файла действительно записана.
2 мин чтения
Подписаться
Получайте новые статьи по email сразу после публикации. Без спама: только заметки про data platforms, distributed systems и AI tooling.
Email хранится только для этой self-hosted рассылки.