Новости по тегу "data"
Подборка публикаций, содержащих тег "data". Актуальные темы и важные события.

YTsaurus — два года в опенсорсе: чего мы достигли и куда движемся
20 марта мы провели митап для пользователей YTsaurus — главной платформы для хранения и обработки больших данных в Яндексе от разработчиков из...

Обработка геоданных для ML-задач. Часть 2: пространственные объединения и расстояния
Статья продолжает обсуждение пространственных признаков в Python. Здесь мы рассматриваем пространственные объединения — аналог обычного...

7 опорных функций, которые должны быть в вашей системе Data Governance
Привет, Хабр! Я Татьяна, в РСХБ-Интех работаю с данными, в прошлый раз я рассказывала про свои любимые фреймворки для повышения эффективности...

Стриминг Apache Flink из MongoDB в PostgreSQL на Python
Привет, Хабр! Меня зовут Александр Цай, я ведущий аналитик в МТС Web Services, но на деле занимаюсь всеми вопросами, касающимися DA/DE/BI:...

Переход из Oracle в Postgres Pro: не просто смена СУБД, а сдвиг подхода. Интервью с Марком Ривкиным
Давно не было обстоятельных интервью, тем более с таким корифеем отечественной СУБД‑разработки. В 2022 году в Postgres Professional перешла...

Погружение в ClickHouse: делаем первые и успешные шаги
Привет! Меня зовут Андрей Дорожкин, и я руковожу командой администрации баз данных в Hybrid. В этом материале я поделюсь опытом работы с...

Всё как в жизни. Адаптация систем распознавания жестовых языков к реальным условиям
Всем привет! Ранее мы уже писали о том, как собрали самый большой и разнородной открытый датасет русского жестового языка, как выбили первое место...

ТОП-5 инструментов для начинающего тестировщика
Привет, Хабр! Я Герман, стажер QА-инженер в ОТП Банке. Моя профессия всегда актуальна на рынке ИТ, и поэтому я решил рассказать о необходимом...

Книги для Team Lead DS: от менеджмента к стратегии
Привет! Меня зовут Марк Паненко, я Chief Data Science в Ozon Банке. Это завершающая статья цикла о книгах для Data Science. Ранее мы обсуждали...

Миф о дешевом железе: полный расчет стоимости КХД для облака и локальных решений
Корпоративное хранилище данных (КХД) — один из ключевых компонентов любой ИТ-системы, который необходим для безопасного хранения и использования...

Как я оставила печати и взяла SQL: путь к Data Quality
Привет, Хабр! Когда-то я проверяла завещания и готовила доверенности, а теперь проверяю витрины данных, ищу дубли и считаю доходность по...

[Перевод] DWH: История поиска альтернативы PostgreSQL и Snowflake. Часть 1
Выбор облачного хранилища данных — задача не из тривиальных, особенно когда речь идёт о миллиардах полуструктурированных записей, геоаналитике и...