Новости по тегу "обработка данных"

Подборка публикаций, содержащих тег "обработка данных". Актуальные темы и важные события.

Нет изображения

«Эра Flink 2.0»: что реально меняется в архитектуре real‑time вычислений

Apache Flink 2.0 — первый мажорный релиз после 1.0 (2016), закрывающий многолетний цикл эволюции архитектуры и устраняющий накопленные болевые...

20.07.2025 07:00
7
Нет изображения

Основы ETL на примере работы с Superset, Airflow и ClickHouse

В этой статье я расскажу, как можно запустить простой ETL-процесс на виртуальном сервере, используя связку Superset, Airflow и ClickHouse. В...

17.07.2025 16:09
9
Нет изображения

Сквозь тернии к апдейту: история о том, как мы обновляли стриминг ОК

Стриминговые данные — важная часть многих современных ИТ-платформ. Они активно используются в разных разделах социальной сети Одноклассники уже...

03.07.2025 14:09
14
Нет изображения

Как мы построили свой инструмент для работы с LLM

Привет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и...

02.07.2025 08:01
14
Нет изображения

Машинное обучение в решении задач медицинской метагеномики

Машинное обучение проникает во все большее число научных и прикладных областей — от финансов до биомедицины. Даже такая сложная и специфичная...

26.06.2025 13:26
13
Нет изображения

Как мы заменили сотни Join’ов на один РТ-процессинг с 1kk RPS

Как связаны скидки, пользовательские пути и огромные массивы данных в Яндекс Рекламе? Привет, Хабр! Меня зовут Максим Стаценко, я работаю с базами...

10.06.2025 09:07
16
Нет изображения

Apache Flink для начинающих: архитектура, библиотеки и применение

Apache Flink — это фреймворк и распределенный движок обработки данных, поддерживающий какпакетную (ограниченную), так и потоковую...

02.06.2025 08:39
18
Нет изображения

Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2

Всем привет, меня зовут Василий. С 2021 года работаю в роли инженера данных в Х5 Tech, успел за это время познакомиться с несколькими интересными...

22.05.2025 13:18
21
Нет изображения

[Перевод] Поднимайте If вверх, опускайте For вниз

Эта статья — краткая заметка о двух связанных друг с другом эмпирических правилах.Поднимайте If вверхЕсли внутри функции есть условие if, то...

22.05.2025 10:01
21
Нет изображения

Переходим от legacy к построению Feature Store

Невероятная история о том, как внедрить систему Feature Store в проект с огромным legacy и получить профит.Привет, Хабр! Меня зовут Евгений...

13.05.2025 14:45
26
Нет изображения

Концепция построения централизованной аналитики

Централизованная аналитика — это фундамент эффективного принятия решений в компании. Чтобы данные действительно работали на бизнес, они должны...

13.05.2025 08:00
23
Нет изображения

[Перевод] Как писать запросы для табличных моделей с помощью DAX

В этой статье мы погрузимся в мир запросов DAX для табличных моделей данных. ДAX (Data Analysis Expressions) — это мощный язык запросов, который...

25.04.2025 12:04
24