Новости по тегу "data"
Подборка публикаций, содержащих тег "data". Актуальные темы и важные события.

KStorage — единый подход к key-value хранилищам на Kotlin Multiplatform
Типобезопасное Key-Value хранилище для Kotlin Multiplatform. Единый API без боли, бойлерплейта и потери рассудка Прочитать и убрать бойлерплейт из проекта

ИИ в Data Governance: как мы ускорили маркировку персональных данных
В статье описывается как мы c командой определяли, где и как будем использовать искусственный интеллект, как тестировали обученные модели и как...

Data-driven подход: ищем максимальный ресурс команды
Общая боль руководителей при планировании работы: как равномерно распределить задачи так, чтобы проекты шли по плану, а люди не выгорали. Чаще...

DATAREON VS Apache NiFi
Всем привет! На связи Никита Скирдин, программист 1С ИТ-интегратора «Белый код». Статья появилась как результат небольшого исследования для одного...

Почему SCD Type 2 медленно работает в DWH, и как это чинится через Merge + Hash
Привет, Хабр!В этом статье рассмотрим, почему классическая реализация SCD Type 2 в DWH начинает жутко тормозить на миллионах строк и как с этим...

Скрытая стоимость BI: что не учитывают 8 из 10 компаний при внедрении аналитических систем
Почему, по данным экспертов GlowByte, целых 80% проектов внедрения систем бизнес-аналитики выходят за рамки изначально запланированного бюджета?...

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов
В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования...

Как сделать улётную ИТ-конференцию: опыт программного директора CodeFest
Всем привет! Меня зовут Денис Яковлев, я Technical Project Manager в Яндексе и программный директор ИТ-конференции CodeFest. В статье расскажу о...

Переходим от legacy к построению Feature Store
Невероятная история о том, как внедрить систему Feature Store в проект с огромным legacy и получить профит.Привет, Хабр! Меня зовут Евгений...

Концепция построения централизованной аналитики
Централизованная аналитика — это фундамент эффективного принятия решений в компании. Чтобы данные действительно работали на бизнес, они должны...

Picodata: вторая жизнь in-memory баз данных
Привет, меня зовут Костя Осипов, и я занимаюсь разработкой СУБД. На Хабре есть несколько моих статей про MySQL, Tarantool и про всякое-разное....

Пакетная репликация данных в аналитическом ландшафте ХД
Наполнение данными хранилища или озера, как правило, является первым большим шагом к доступности аналитической среды для основного функционала и...