Новости по тегу "большие данные"

Подборка публикаций, содержащих тег "большие данные". Актуальные темы и важные события.

Нет изображения

Apache Superset — почему все топы рынка выбрали именно его?

Попытка по-иному ответить на вопрос "какую BI-системы выбрать"? Вместо сравнения систем сделаем проще - оценим рынок и расскажем о возможностях...

22.08.2025 13:59
16
Нет изображения

[Перевод] Ленивые вычисления в PHP: как генераторы и итераторы экономят память и ускоряют код

Как обрабатывать миллионы строк в PHP и не убить память?Всё просто: генераторы и итераторы. Покажу, как ленивые вычисления экономят ресурсы,...

22.08.2025 12:15
11
Нет изображения

Российский новый университет подключился к «РосНавыку»

9 июля для ректората Российского нового университета (РосНОУ) при поддержке Университетского консорциума исследователей больших данных прошёл...

09.07.2025 12:01
18
Нет изображения

Большие данные для карт в реальном времени. Inception

Возникла необходимость зафиксировать опыт с последнего проекта по прокачке производительности картографического сервиса. Так сказать, чтобы 2 раза...

29.06.2025 06:59
26
Нет изображения

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark

Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде ETL-платформы MWS Data (ex DataOps). Часто сталкиваюсь с тем, что в...

19.06.2025 07:00
25
Нет изображения

Проблемы данных ритейла и их решение через BI-систему

Представьте ситуацию: у вас есть доступ ко всем данным компании – о каждом клиенте, каждой транзакции, каждом движении товара. Но когда нужно...

17.06.2025 07:28
27
Нет изображения

Соединение SortMergeJoin в Apache Spark

Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в исходный код на GitHub. Spark написан на языке Scala, и вся логика...

02.06.2025 13:09
40
Нет изображения

Чем опасен apply() и почему его стоит заменить

Привет, Хабр!Сегодня рассмотрим почему DataFrame.apply() — это так себе инструмент в 2025 году, чем его заменять и как писать dataframe-логику...

30.05.2025 13:21
34
Нет изображения

[Перевод] Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

Почему соцсети показывают рекламу так, словно читают мысли? Как случайная фраза превращается в недели демонстрируемого контента? Действительно ли...

25.04.2025 18:33
40
Нет изображения

Со скоростью кометы: ускоряем Spark без переписывания кода

Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в компании «Криптонит». В этой статье хочу поделиться с вами...

22.04.2025 09:38
40
Нет изображения

YTsaurus — два года в опенсорсе: чего мы достигли и куда движемся

20 марта мы провели митап для пользователей YTsaurus — главной платформы для хранения и обработки больших данных в Яндексе от разработчиков из...

16.04.2025 11:00
41