Adaptive Query Execution в Spark 3: как умная оптимизация покончила с ручными танцами с бубном
Представим ситуацию: мы спланировали маршрут до точки назначения, предположили,...
Подборка публикаций, содержащих тег "Spark". Актуальные темы и важные события.
Представим ситуацию: мы спланировали маршрут до точки назначения, предположили,...
Качество данных — это не просто вопрос наличия значений в столбцах таблиц. Это...
Совсем недавно NVIDIA представила DGX Spark — компактный AI-компьютер формата...
Привет, Хабр! Недавно я понял, что не знаю, что такое Hadoop. (На этом моменте...
Привет, Хабр! Это тимлид DS группы ранжирования и поиска Дана Злочевская и...
Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде...
Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки...
В этой серии статей мы пройдемся по каждому этапу работы V8: лексическому и...
В предыдущих сериях ( 1 • 2 • 3 • 4 • 5 • 6 • 7 • Ы ) рассмотрели, как написать...
Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в...
Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы...
¹ …просто потому, что другого варианта добиться необходимого результата тупо не...