Новости по тегу "data engineer"

Подборка публикаций, содержащих тег "data engineer". Актуальные темы и важные события.

Нет изображения

Зачем банку ещё одна ALM-система

Хабр, привет! В этой статье расскажем, как команда банка ВТБ построила собственную аналитическую систему на базе открытых технологий и с...

25.06.2025 10:00
38
Нет изображения

Apache Airflow на практике: погружение в инструмент для оркестрации ETL-процессов

Apache Airflow давно стал стандартом в мире Data Engineering благодаря своей гибкости, масштабируемости и богатой экосистеме. В этой статье мы...

19.06.2025 13:21
31
Нет изображения

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark

Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде ETL-платформы MWS Data (ex DataOps). Часто сталкиваюсь с тем, что в...

19.06.2025 07:00
34
Нет изображения

Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов

За счёт правильных, даже необязательно новых, а просто верно выбранных архитектурных подходов можно заставить работать не один конкретный запрос,...

05.06.2025 09:55
43
Нет изображения

Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

Привет! Меня зовут Влад Божьев, я старший разработчик юнита АБ-тестирования Авито. Один из наших ключевых инструментов – M42, сервис для...

29.05.2025 09:12
47
Нет изображения

ClickHouse как DWH: Производительность без боли и ловушки merge-таблиц

Недавно перед нашей командой встала непростая задача: объем данных для аналитики вырос до 300 миллионов строк в день. Прежние решения перестали...

27.05.2025 10:04
44
Нет изображения

[Перевод] Какую архитектуру данных мне выбрать? — Подход Data-инженера. Часть 1

Выбор архитектуры данных — это не просто техническое решение, а стратегический шаг, от которого зависит эффективность работы с данными во всей...

23.05.2025 16:49
40
Нет изображения

Топ-статей Saint HighLoad++ 2025

В этом году Saint HighLoad++ снова собирает экспертов индустрии на берегу Невы. А я уже знаю, какие темы вызовут настоящий хайп среди инженеров и...

23.05.2025 09:14
45
Нет изображения

Apache Kafka на слое Stage аналитической платформы: зачем, как и грабли на пути

Всем привет! В этой статье поделюсь нашим опытом использования Apache Kafka на слое Stage в аналитической архитектуре. Мы поговорим о том, что...

20.05.2025 08:36
36
Нет изображения

Приходят как-то аналитики на офисную кухню, а там дата-инженеры в нарды играют…

Один из игроков — я, Кирилл Красновид, тимлид BI-команды в Профи.ру. Наша задача — делать так, чтобы каждый быстро и удобно получал нужную...

19.05.2025 13:07
44
Нет изображения

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования...

15.05.2025 09:01
38
Нет изображения

Концепция построения централизованной аналитики

Централизованная аналитика — это фундамент эффективного принятия решений в компании. Чтобы данные действительно работали на бизнес, они должны...

13.05.2025 08:00
42