Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2
Всем привет, меня зовут Василий. С 2021 года работаю в роли инженера данных в...
Подборка публикаций, содержащих тег "Spark". Актуальные темы и важные события.
Всем привет, меня зовут Василий. С 2021 года работаю в роли инженера данных в...
Всем привет! Меня зовут Александр Андреев, я старший SRE инженер данных....
Apache Spark содержит в себе множество различных библиотек, среди которых есть...
Эксперты компании «Криптонит» проанализировали главные тренды использования...
В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах:...
Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA...
Представим себе картину из идеального мира данных, в котором всё стабильно,...
Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в...
Для обработки Common Crawl на терабайтных объёмах широко используются...