Новости по тегу "data lake"
Подборка публикаций, содержащих тег "data lake". Актуальные темы и важные события.

Влияние маленьких файлов на Big Data: HDFS vs S3
Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. В этой статье рассмотрим, как большое количество...

Хакатон Samsung IT Academy Hack 2025: обзор задачи от VK Tech
С ростом объема генерируемых данных повышаются требования к компетенции ИТ-специалистов в части работы с Big Data и решениями для их сбора,...

От точечных решений к экосистеме: как «Национальная Лотерея» улучшает качество данных
Привет, Хабр! Сегодня мы расскажем, как «Национальная Лотерея» — компания, обрабатывающая сотни миллионов транзакций ежегодно, полностью...

[Перевод] Какую архитектуру данных мне выбрать? — Подход Data-инженера. Часть 1
Выбор архитектуры данных — это не просто техническое решение, а стратегический шаг, от которого зависит эффективность работы с данными во всей...

Kafka без дисков: плюсы и минусы KIP‑1150 (Diskless Topics)
TL;DR: KIP‑1150 (Diskless Topics) предлагает Kafka писать сообщения сразу в облачное хранилище (S3 и аналоги), минуя диски брокеров. Это сильно...