Новости по тегу: spark

Новости spark - актуальные события на Toplenta

Природа

Adaptive Query Execution в Spark 3: как умная оптимизация покончила с ручными танцами с бубном

Представим ситуацию: мы спланировали маршрут до точки назначения, предположили,...

19.11.2025 13:00

36

0

Технологии

Data Quality в масштабе Big Data: как мы построили систему контроля качества данных в Hadoop

Качество данных — это не просто вопрос наличия значений в столбцах таблиц. Это...

31.10.2025 16:16

48

0

История

Настольный дата-центр: как NVIDIA упаковала целый ИИ-кластер в корпус 15×15 см

Совсем недавно NVIDIA представила DGX Spark — компактный AI-компьютер формата...

30.10.2025 07:10

44

0

Природа

От реляционных СУБД к экосистеме Hadoop

Привет, Хабр! Недавно я понял, что не знаю, что такое Hadoop. (На этом моменте...

21.08.2025 15:27

72

0

История

От сырого кликстрима к чистым датасетам: как мы в Lamoda Tech варим данные

Привет, Хабр! Это тимлид DS группы ранжирования и поиска Дана Злочевская и...

02.07.2025 07:10

68

0

Природа

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark

Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде...

19.06.2025 07:00

73

0

Природа

Влияние маленьких файлов на Big Data: HDFS vs S3

Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки...

11.06.2025 09:50

97

0

Технологии

Что происходит с вашим JavaScript-кодом внутри V8. Часть 1

В этой серии статей мы пройдемся по каждому этапу работы V8: лексическому и...

06.06.2025 08:53

71

0

Технологии

Пишем движок SQL на Spark. Часть 8: CREATE FUNCTION

В предыдущих сериях ( 1 • 2 • 3 • 4 • 5 • 6 • 7 • Ы ) рассмотрели, как написать...

05.06.2025 13:20

87

0

Красота

Соединение SortMergeJoin в Apache Spark

Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в...

02.06.2025 13:09

94

0

ИИ

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы...

02.06.2025 11:40

87

0

Технологии

Иногда приходится¹ копаться² в кишках³ Apache Spark

¹ …просто потому, что другого варианта добиться необходимого результата тупо не...

27.05.2025 12:54

92

0

Новости по тегу "spark"

Adaptive Query Execution в Spark 3: как умная оптимизация покончила с ручными танцами с бубном

Data Quality в масштабе Big Data: как мы построили систему контроля качества данных в Hadoop

Настольный дата-центр: как NVIDIA упаковала целый ИИ-кластер в корпус 15×15 см

От реляционных СУБД к экосистеме Hadoop

От сырого кликстрима к чистым датасетам: как мы в Lamoda Tech варим данные

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark

Влияние маленьких файлов на Big Data: HDFS vs S3

Что происходит с вашим JavaScript-кодом внутри V8. Часть 1

Пишем движок SQL на Spark. Часть 8: CREATE FUNCTION

Соединение SortMergeJoin в Apache Spark

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Иногда приходится¹ копаться² в кишках³ Apache Spark

Фильтры и сортировка