Новости по тегу "Data Engineering"

Подборка публикаций, содержащих тег "Data Engineering". Актуальные темы и важные события.

Нет изображения

Apache Kafka на слое Stage аналитической платформы: зачем, как и грабли на пути

Всем привет! В этой статье поделюсь нашим опытом использования Apache Kafka на слое Stage в аналитической архитектуре. Мы поговорим о том, что...

20.05.2025 08:36
19
Нет изображения

Приходят как-то аналитики на офисную кухню, а там дата-инженеры в нарды играют…

Один из игроков — я, Кирилл Красновид, тимлид BI-команды в Профи.ру. Наша задача — делать так, чтобы каждый быстро и удобно получал нужную...

19.05.2025 13:07
23
Нет изображения

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования...

15.05.2025 09:01
21
Нет изображения

Концепция построения централизованной аналитики

Централизованная аналитика — это фундамент эффективного принятия решений в компании. Чтобы данные действительно работали на бизнес, они должны...

13.05.2025 08:00
23
Нет изображения

Ну ты это, заходи если чё: как сделать единую систему авторизации в корпоративных ботах

Привет, Хабр! На связи команда данных «МосТрансПроекта». Недавно мы рассказывали про бот «Информатум», в котором хранятся служебные презентации....

12.05.2025 21:20
18
Нет изображения

Ну ты это, заходи если чё: как сделать единую систему авторизации в корпоративных ботах

Привет, Хабр! На связи команда данных «МосТрансПроекта». Недавно мы рассказывали про бот «Информатум», в котором хранятся служебные презентации....

12.05.2025 21:15
19
Нет изображения

Join таблиц в реальном времени на Apache Flink

Статья посвящена реализации join-операций в системах потоковой обработки данных на базе Apache Flink. Рассматриваются основные подходы к...

07.05.2025 12:53
26
Нет изображения

Эра Big Data: новые возможности в принятии решений

Big Data - это огромные объёмы данных, которые невозможно обработать с помощью традиционных методов.Они могут быть структурированными (например,...

24.04.2025 13:52
29
Нет изображения

Со скоростью кометы: ускоряем Spark без переписывания кода

Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в компании «Криптонит». В этой статье хочу поделиться с вами...

22.04.2025 09:38
26
Нет изображения

Стриминг Apache Flink из MongoDB в PostgreSQL на Python

Привет, Хабр! Меня зовут Александр Цай, я ведущий аналитик в МТС Web Services, но на деле занимаюсь всеми вопросами, касающимися DA/DE/BI:...

15.04.2025 12:48
33