Новости по тегу "gpu"
Подборка публикаций, содержащих тег "gpu". Актуальные темы и важные события.

Почём ИИ для народа: протестировали платформу YADRO G4208P с восемью H100 NVL и RTX 4090 на десятке ИИ-моделей
Привет, Хабр! Меня зовут Артём Маклаев, вместе с командой я занимаюсь оценкой производительности серверных платформ для задач искусственного...

Как мы разрабатываем отечественный AI-процессор. Часть 1. Почему GPGPU?
«We have a phrase inside Intel. We are supposed to be a data driven company and the phrase is, "Don't argue with the emotions, argue with the...

Шпаргалка по установке драйверов NVIDIA на ML сервер
Данный материал предназначен для быстрой и последовательной установки драйверов NVIDIA, в том числе для видеокарт 50xx серии, а также настройки...

Эффективное использование GPU в Kubernetes: Настройка и использование Volcano Scheduler + Volcano vGPU Device Plugin
В этой статье я расскажу, как можно разделить GPU на vGPU в кластере Kubernetes с поддержкой жесткой изоляции, используя Volcano и Volcano vGPU...

Как приручить Горыныча: русская high availability с тремя головами
В одном царстве, в одном хостинг-государстве жил-был сказочный Змей Горыныч. Он был трёхголовым, распределённым и главное отказоустойчивым....

Дата-центр на орбите: технические особенности футуристической концепции
Недавние проекты — от китайской «Трёхтелесной вычислительной констелляции» с ИИ-спутниками до коммерческих инициатив вроде Lumen Orbit и Lonestar...

Распределённый инференс и шардирование LLM. Часть 3: настройка авторизации и интеграция с Open WebUI
Мы с вами подобрались к заключительной части статьи-инструкции об организации распределённого инференса и шардирования LLM в домашних условиях....

Апрельские обновления в продуктах и услугах Selectel
Привет! С вами снова Саша из Selectel. В этом дайджесте рассказываю, как обновились наши продукты в апреле. Под катом — серверы с SelectOS, iOS в...

Linux для начинающих: WSL — это читерство. Как Microsoft дал нам Linux без головной боли
В этой статье я хочу поделиться своим опытом настройки WSL для комфортной разработки, а также размышлениями о том, почему такой подход оказался...

[Перевод] Объяснение графических процессоров для тех, кто привык работать с ЦП
За годы работы я подробно изучил, как центральные процессоры (CPU) выполняют код и как они устроены внутри. Дело в том, что я участвовал в...

Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster
Продолжаем пошагово разбираться с ответом на вопрос о том, как эффективно работать с передовыми LLM, используя доступное оборудование и...

Мощнее, холоднее и дешевле, чем RTX 4060 Ti: обзорщики высоко оценили RTX 5060 Ti 16 ГБ
Эволюция видеокарт среднего сегмента всегда была интересным зрелищем. Для опытного производителя вроде NVIDIA не составляло особого труда сделать...