Новости по тегу "big data"

Подборка публикаций, содержащих тег "big data". Актуальные темы и важные события.

Нет изображения

MWS Data Compass: как мы в МТС свой корпоративный BI построили

Привет, Хабр! Я Павел Шестаков, Product Owner BI в MWS. За последние годы цифровой трансформации в нашей компании многие команды прошли путь от...

23.07.2025 12:00
1
Нет изображения

Data Lake 2.0: Iceberg и Parquet в бою за миллисекунды

Привет, Хабр! Меня зовут Валерий Бабушкин, я CDO МТС Web Services. Если достаточно много занимаешься машинным обучением, то однажды начинаешь...

17.07.2025 07:00
11
Нет изображения

Алгоритмы для работы с большими данными в Go: HyperLogLog и Count-Min Sketch

Алгоритмы для работы с большими даннымиВсем привет! Для начала давайте разберем что такое вообще Алгоритмы для работы с большими данными, основная...

13.07.2025 05:16
6
Нет изображения

DWH без иллюзий. Три реальных кейса внедрения корпоративного хранилища в ритейле, производстве и госсекторе

Проект построения хранилища данных — это не просто внедрение технологий, а глубокая трансформация подходов к данным и аналитике, учитывающая...

07.07.2025 12:39
9
Нет изображения

Зачем банку ещё одна ALM-система

Хабр, привет! В этой статье расскажем, как команда банка ВТБ построила собственную аналитическую систему на базе открытых технологий и с...

25.06.2025 10:00
14
Нет изображения

Как мы обучали ML-модель для выявления подозрительных ставок в системе DoseSports

Привет, Хабр. Меня зовут Виктор, я Big Data Engineer в antifraud-направлении. В этом посте хочу рассказать о том, как мы выстраивали процесс...

19.06.2025 08:06
12
Нет изображения

Рост продаж с одновременным ростом конверсии: подход билайн к внедрению AutoML в маркетинг

Выбрать лучшую рекомендацию для клиента в условиях ограничений коммуникационной нагрузки можно через оценку релевантности продукта, его влияния на...

06.06.2025 08:07
18
Нет изображения

Пишем движок SQL на Spark. Часть 8: CREATE FUNCTION

В предыдущих сериях ( 1 • 2 • 3 • 4 • 5 • 6 • 7 • Ы ) рассмотрели, как написать на Java собственный интерпретатор объектно-ориентированного...

05.06.2025 13:20
17
Нет изображения

Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов

За счёт правильных, даже необязательно новых, а просто верно выбранных архитектурных подходов можно заставить работать не один конкретный запрос,...

05.06.2025 09:55
19
Нет изображения

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы регулярно запускаем PySpark-приложения в Kubernetes-кластере,...

02.06.2025 11:40
21
Нет изображения

Иногда приходится¹ копаться² в кишках³ Apache Spark

¹ …просто потому, что другого варианта добиться необходимого результата тупо не существует. ² и да, довольно-таки глубоко. ³ нет, серьёзно!...

27.05.2025 12:54
22
Нет изображения

Почему Apache Spark становится ядром аналитических платформ в России: тренды, особенности и прогнозы для бизнеса

Эксперты компании «Криптонит» проанализировали главные тренды использования Apache Spark в бизнесе, выделили особенности его применения в России и...

20.05.2025 09:59
22