Новости по тегу "Data"
Подборка публикаций, содержащих тег "Data". Актуальные темы и важные события.

Как мы обучали ML-модель для выявления подозрительных ставок в системе DoseSports
Привет, Хабр. Меня зовут Виктор, я Big Data Engineer в antifraud-направлении. В этом посте хочу рассказать о том, как мы выстраивали процесс...

Как мы решили проблему батчевых загрузок в реляционные СУБД, или Немного хорошего о «худших практиках» в Spark
Всем привет! Меня зовут Алексей Николаев, я работаю дата-инженером в команде ETL-платформы MWS Data (ex DataOps). Часто сталкиваюсь с тем, что в...

Вселенная на ладони: крупнейший релиз данных JWST открывает космос для всех
В июне 2025 года астрономы всего мира получили доступ к огромному массиву данных от телескопа Джеймс Уэбб (JWST). Проект COSMOS-Web,...

Что скрывается за EIP-712: подробный разбор стандарта
EIP-712 — это стандарт, который делает подписи в Ethereum не только безопасными, но и человекочитаемыми. Он позволяет кошелькам показывать...

Топ полезных функций в DataLens и Tableau
В прошлой статье мы разбирали 6 способов сэкономить место на дашборде с помощью интерактивности в Tableau. Те, кто работал с Tableau, знают: это...

Облаку Рег.ру два года — задуваем свечи и вспоминаем знаковые релизы
В июне облаку Рег.ру исполняется два года — время оглянуться назад и провести ретро по крупным продуктовым релизам. А их за это время было порядка...

Что бы я сделал, если бы сегодня начинал учить Data Science / ML?
Machine Learning и Data Science — это одни из самых популярных и востребованных направлений в IT. Но вместе с этим — они и одни из самых сложных...

Тренды 2025 года в сфере работы с данными и ИИ
Привет! Меня зовут Антон Моргунов, я академический руководитель программы онлайн-магистратуры Яндекса и МИФИ «Специалист по работе с данными и...

Как читать карту МПТ Москвы и рассчитать льготу за застройку через BI инструменты
Где в Москве строить выгоднее?Я собрал интерактивную карту, которая показывает районы и кварталы столицы по коэффициенту МПТ — ключевому параметру...

Влияние маленьких файлов на Big Data: HDFS vs S3
Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. В этой статье рассмотрим, как большое количество...

От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию
В современном мире объемы данных растут экспоненциально: компании ежедневно генерируют и обрабатывают огромные массивы информации — от реляционных...

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench
В статье представлено многоязычное расширение SWE-Bench от команды Doubletapp — бенчмарка для оценки больших языковых моделей (LLM) на реальных...