Новости по тегу "Data"

Подборка публикаций, содержащих тег "Data". Актуальные темы и важные события.

Нет изображения

MVP по «умному» поиску данных

Всем привет, меня зовут Александр, я аналитик в Альфа-Банке. Совместно с командой мы разрабатываем и развиваем платформу для дата-инженеров (DE) и...

03.06.2025 10:01
2
Нет изображения

Соединение SortMergeJoin в Apache Spark

Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в исходный код на GitHub. Spark написан на языке Scala, и вся логика...

02.06.2025 13:09
3
Нет изображения

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы регулярно запускаем PySpark-приложения в Kubernetes-кластере,...

02.06.2025 11:40
3
Нет изображения

T-SQL в .NET Core EF Core: Гибридный подход к производительности и гибкости (Переосмысление с учетом обсуждения)

Секретное оружие в .NET Core: Почему вы игнорируете мощь T-SQL? Ваши LINQ-запросы становятся громоздкими? Производительность упирается в потолок?...

30.05.2025 14:33
7
Нет изображения

Батл вендоров 2.0: как настроили интеграционный поток создатели платформ DATAREON, Entaxy ION и USEBUS

На связи Сергей Скирдин, технический директор ИТ-интегратора «Белый код». В начале этого года мы провели первый батл между создателями...

30.05.2025 14:24
6
Нет изображения

Хакатон Samsung IT Academy Hack 2025: обзор задачи от VK Tech

С ростом объема генерируемых данных повышаются требования к компетенции ИТ-специалистов в части работы с Big Data и решениями для их сбора,...

30.05.2025 09:01
6
Нет изображения

От точечных решений к экосистеме: как «Национальная Лотерея» улучшает качество данных

Привет, Хабр! Сегодня мы расскажем, как «Национальная Лотерея» — компания, обрабатывающая сотни миллионов транзакций ежегодно, полностью...

29.05.2025 10:13
9
Нет изображения

Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

Привет! Меня зовут Влад Божьев, я старший разработчик юнита АБ-тестирования Авито. Один из наших ключевых инструментов – M42, сервис для...

29.05.2025 09:12
9
Нет изображения

Как консолидировать данные из разрозненных хранилищ с помощью Tarantool CDC

Компании часто сталкиваются с необходимостью переливать данные между системами. Но нередко это превращается в настоящий квест: форматы данных...

28.05.2025 08:59
7
Нет изображения

[Перевод] Spring Data Ahead of Time репозитории

Команда Spring АйО перевела статью про новую версию AOT-репозиториев, которые позволяют генерировать реализацию методов запросов на этапе сборки....

28.05.2025 07:58
7
Нет изображения

Иногда приходится¹ копаться² в кишках³ Apache Spark

¹ …просто потому, что другого варианта добиться необходимого результата тупо не существует. ² и да, довольно-таки глубоко. ³ нет, серьёзно!...

27.05.2025 12:54
8