Новости по тегу "данные"
Подборка публикаций, содержащих тег "данные". Актуальные темы и важные события.

Передача персональных данных за рубеж: разрешен ли Google Analytics и как работать по правилам
В последние месяцы в сети появились сообщения о запрете на использование Google Analytics (GA) — о том, что Роскомнадзор требует убрать счетчик с...

[Перевод] Эволюция Java в 2025 году: ключевые тренды и успешные кейсы
В 2025 году Java продолжает развиваться благодаря таким технологиям, как GraalVM и Project Loom. Язык становится более быстрым и эффективным...

Почему синтетические данные редко используются в реальных задачах
Синтетические данные – это искусственно сгенерированные наборы, имитирующие структуру и статистические закономерности реальных данных. В последние...

Как я допилил аналог Google Sheets, чтобы хранить данные за пазухой
С 1 июля 2025 года хранить персональные данные россиян в иностранных сервисах больше нельзя. Назрел вопрос, что же делать, например, с...

Грязные данные для вечного сияния чистого ИИ
Эпиграф: Это хуже чем преступление. Это ошибкаИскусственный интеллект становится неотъемлемой частью современной жизни. Масштаб и скорость...

Соединение SortMergeJoin в Apache Spark
Рассмотрим, как реализован SortMergeJoin в Apache Spark, и заодно заглянем в исходный код на GitHub. Spark написан на языке Scala, и вся логика...

Как уведомить Роскомнадзор об обработке персональных данных: пошаговая инструкция для ИТ-компаний и стартапов
Для современной компании, будь то разработчик ПО, SaaS-провайдер или активный пользователь облачных платформ, CRM и аналитики, корректная...

Чем опасен apply() и почему его стоит заменить
Привет, Хабр!Сегодня рассмотрим почему DataFrame.apply() — это так себе инструмент в 2025 году, чем его заменять и как писать dataframe-логику...

Быстрый старт в маскировании данных PostgreSQL с инструментом pg_anon
В этой статье поговорим о не самом гламурном, но жизненно важном — маскировании данных. Маскирование может касаться имён, телефонов, номеров карт,...

Создаем Telegram-бота для генерации случайных пользовательских данных на Python
Привет, Хабр! Сегодня я хочу поделиться опытом создания полезного инструмента для разработчиков и тестировщиков — Telegram-бота, который...

Переосмысляя Serverless. Парадигма хранения и обработки данных
Много было сказано про Serverless в нагрузках без сохранения состояния. Действительно, когда у вас есть контейнеры или функции их легко почти...

Еще чуть-чуть быстрее ищем кратчайший путь на Python
Привет! На связи команда геоаналитики ecom.tech, мы строим модели машинного обучения на основе пространственных данных для задач ритейла в...