Новости по тегу "большие данные"

Подборка публикаций, содержащих тег "большие данные". Актуальные темы и важные события.

Нет изображения

Соединение SortMergeJoin в Apache Spark

Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в исходный код на GitHub. Spark написан на языке Scala, и вся логика...

02.06.2025 13:09
10
Нет изображения

Чем опасен apply() и почему его стоит заменить

Привет, Хабр!Сегодня рассмотрим почему DataFrame.apply() — это так себе инструмент в 2025 году, чем его заменять и как писать dataframe-логику...

30.05.2025 13:21
9
Нет изображения

[Перевод] Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

Почему соцсети показывают рекламу так, словно читают мысли? Как случайная фраза превращается в недели демонстрируемого контента? Действительно ли...

25.04.2025 18:33
13
Нет изображения

Со скоростью кометы: ускоряем Spark без переписывания кода

Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в компании «Криптонит». В этой статье хочу поделиться с вами...

22.04.2025 09:38
17
Нет изображения

YTsaurus — два года в опенсорсе: чего мы достигли и куда движемся

20 марта мы провели митап для пользователей YTsaurus — главной платформы для хранения и обработки больших данных в Яндексе от разработчиков из...

16.04.2025 11:00
18