Новости по тегу "data"
Подборка публикаций, содержащих тег "data". Актуальные темы и важные события.

Искусственный интеллект в медицине: Революция в здравоохранении
Медицина быстро адаптируется к достижениям в области искусственного интеллекта (ИИ). Благодаря ИИ появляются новые возможности для диагностики,...

MLSecOps: защита машинного обучения в эпоху киберугроз
MLSecOps: защита машинного обучения в эпоху киберугрозНа днях исследователь Цзянь Чжоу сообщил о критической уязвимости (CVE-2025-32434),...

JavaScript. Как сделать невероятно быстрый многопоточный Data Grid на 1 000 000 строк. Часть 2/2: работа с потоками
Demo | GitHubОсобенности Fast Data Grid:— Невероятно быстрый— Многопоточный— Всего 523 строчки кода— Нет зависимостей— Vanilla...

Как из аналитики данных перейти в дата-сайентисты
Перевели и дополнили статью Марины Уисс, applied scientist (дата-сайентист со специализацией в прикладной статистике) в Twitch. Когда-то Марина...

Data Science в рекрутинге: как структурировать хаос резюме и находить лучших кандидатов. (часть 1)
Подбор персонала — это поиск иголки в стоге сена, с одной оговоркой: иголка должна хотеть работать именно у вас. Когда на входе — сотни резюме с...

Как мы научились эффективно работать с техническим долгом
Доброго времени, Хабр! Меня зовут Эдвард. В сфере обеспечения качества я с 2012 года. Последние 7 лет работаю в Т-Банке, начинал со старшего...

Kafka без дисков: плюсы и минусы KIP‑1150 (Diskless Topics)
TL;DR: KIP‑1150 (Diskless Topics) предлагает Kafka писать сообщения сразу в облачное хранилище (S3 и аналоги), минуя диски брокеров. Это сильно...

Full-stack в аналитике: почему это будущее Data Science?
Привет.Представьте: вы запилили нейросеть, которая определяет котиков на фото с точностью 99.9% (оставшиеся 0.1% — это когда хомяк притворяется...

Эра Big Data: новые возможности в принятии решений
Big Data - это огромные объёмы данных, которые невозможно обработать с помощью традиционных методов.Они могут быть структурированными (например,...

Секреты Spark в Arenadata Hadoop: как мы ускорили построение витрин для задач ML
Привет, Хабр! Я Дмитрий Жихарев, CPO Платформы искусственного интеллекта RAISA в Лаборатории ИИ РСХБ-Интех. В этой статье я и архитектор нашей...

Обработка геоданных для ML-задач. Часть 3: агрегирование данных и оценка пространственных шаблонов
Пространственное агрегирование помогает контролировать степень детализации данных в зависимости от пространственных характеристик отдельных...

Со скоростью кометы: ускоряем Spark без переписывания кода
Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в компании «Криптонит». В этой статье хочу поделиться с вами...