Новости по тегу "bigdata"

Подборка публикаций, содержащих тег "bigdata". Актуальные темы и важные события.

Нет изображения

Сквозь тернии к апдейту: история о том, как мы обновляли стриминг ОК

Стриминговые данные — важная часть многих современных ИТ-платформ. Они активно используются в разных разделах социальной сети Одноклассники уже...

03.07.2025 14:09
8
Нет изображения

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark

Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде ETL-платформы MWS Data (ex DataOps). Часто сталкиваюсь с тем, что в...

19.06.2025 07:00
13
Нет изображения

Вселенная на ладони: крупнейший релиз данных JWST открывает космос для всех

В июне 2025 года астрономы всего мира получили доступ к огромному массиву данных от телескопа Джеймс Уэбб (JWST). Проект COSMOS-Web,...

18.06.2025 13:15
11
Нет изображения

Облаку Рег.ру два года — задуваем свечи и вспоминаем знаковые релизы

В июне облаку Рег.ру исполняется два года — время оглянуться назад и провести ретро по крупным продуктовым релизам. А их за это время было порядка...

17.06.2025 08:21
13
Нет изображения

Влияние маленьких файлов на Big Data: HDFS vs S3

Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. В этой статье рассмотрим, как большое количество...

11.06.2025 09:50
16
Нет изображения

Соединение SortMergeJoin в Apache Spark

Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в исходный код на GitHub. Spark написан на языке Scala, и вся логика...

02.06.2025 13:09
20
Нет изображения

Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

Привет! Меня зовут Влад Божьев, я старший разработчик юнита АБ-тестирования Авито. Один из наших ключевых инструментов – M42, сервис для...

29.05.2025 09:12
19
Нет изображения

Построение платформы данных: подход и стек

Привет, меня зовут Ольга, и в этой статья я хочу поделиться с вами опытом по выбору стека для построения решений в области данных. Как CDO я...

27.05.2025 08:29
17
Нет изображения

RAG‑агент для автоматизации инцидент‑менеджмента

Современные крупные организации сталкиваются с большим числом ИТ‑инцидентов — счет может идти на тысячи в месяц. Инциденты нередко повторяются со...

24.05.2025 12:02
16
Нет изображения

SRE в инженерии данных: профессия и ее перспективы

Всем привет! Меня зовут Александр Андреев, я старший SRE инженер данных. Сегодня я хочу рассказать о необычной, но набирающей обороты роли в...

22.05.2025 09:30
17
Нет изображения

Китайская ИИ-революция и развитие BI: чему нам стоит поучиться

Привет, Хабр! На связи Business Intelligence GlowByte. Три года назад мы в GlowByte провели первую конференцию, на которой рассказали о китайском...

21.05.2025 06:49
20
Нет изображения

Почему Apache Spark становится ядром аналитических платформ в России: тренды, особенности и прогнозы для бизнеса

Эксперты компании «Криптонит» проанализировали главные тренды использования Apache Spark в бизнесе, выделили особенности его применения в России и...

20.05.2025 09:59
20