Новости по тегу "bigdata"

Подборка публикаций, содержащих тег "bigdata". Актуальные темы и важные события.

Нет изображения

Как мы мигрировали на новый шардированный кластер ClickHouse

Всем привет! Меня зовут Мурад Арфанян, я разработчик информационных систем в Ozon Tech. Наша команда работает с данными жизненного цикла товаров в...

29.08.2025 15:25
9
Нет изображения

Проблема маленьких файлов. Оценка замедления S3 и проблем HDFS и Greenplum при работе ними

Не так давно в блоге компании Arenadata был опубликован материал тестирования поведения различных распределенных файловых систем при работе с...

26.08.2025 19:30
12
Нет изображения

Как t2 масштабировал BI-аналитику на 4500+ пользователей: кейс миграции на FineBI

Уходящие с рынка западные BI-решения оставили компании перед сложным выбором. Как найти альтернативу, которая не только заменит функционал, но и...

21.08.2025 14:00
10
Нет изображения

WAP паттерн в data-engineering

Несмотря на бурное развитие дата инжиниринга, WAP паттерн долгое время незаслуженно обходят стороной. Кто-то слышал о нем, но не применяет. Кто-то...

16.08.2025 06:15
13
Нет изображения

[Перевод] 7 взаимозаменяемых решений, которые мгновенно ускорят ваши рабочие процессы Data Science на Python

Хотите сделать свои Python-скрипты для анализа данных быстрее без переписывания кода? NVIDIA предлагает 7 простых замен стандартных библиотек,...

15.08.2025 12:22
9
Нет изображения

[Перевод] StarRocks 3.5: Snapshot, Load Spill, партиции, MV, транзакции, безопасность

StarRocks 3.5 приносит точечные улучшения по надёжности, производительности и безопасности: кластерные Snapshot для DR в архитектуре shared-data...

08.08.2025 05:51
16
Нет изображения

AutismSmartDetector: Система для определения черт аутистического спектра

Оригинал материалаПроект "AutismSmartDetector" представляет собой инновационную систему на основе искусственного интеллекта, предназначенную для...

05.08.2025 16:06
21
Нет изображения

Выбор стратегии компактизации в ScyllaDB

ScyllaDB — это высокопроизводительная NoSQL база данных, созданная как улучшенная версия Apache Cassandra на C++. Она способна обрабатывать...

03.08.2025 17:31
15
Нет изображения

Информационная безопасность – забота каждого из нас

В середине июля в Центре событий РБК прошёл форум информационных технологий INFO Space. Одна из секций была посвящена теме информационной...

23.07.2025 08:47
20
Нет изображения

Сквозь тернии к апдейту: история о том, как мы обновляли стриминг ОК

Стриминговые данные — важная часть многих современных ИТ-платформ. Они активно используются в разных разделах социальной сети Одноклассники уже...

03.07.2025 14:09
30
Нет изображения

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark

Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде ETL-платформы MWS Data (ex DataOps). Часто сталкиваюсь с тем, что в...

19.06.2025 07:00
26
Нет изображения

Вселенная на ладони: крупнейший релиз данных JWST открывает космос для всех

В июне 2025 года астрономы всего мира получили доступ к огромному массиву данных от телескопа Джеймс Уэбб (JWST). Проект COSMOS-Web,...

18.06.2025 13:15
27