Новости по тегу: Инференс

ИИ

«Золотая рыбка, хочу LLM без GPU»: как собрать Inference-сервер на CPU

Допустим, вам нужно протестировать LLM на сотни миллиардов или почти триллион...

14.11.2025 07:00

35

0

ИИ

AMD приобрела ИИ-стартап MK1, созданный ветеранами Neuralink

Компания AMD объявила о покупке ИИ-стартапа MK1 для наращивания своих...

11.11.2025 16:36

28

0

ИИ

Как приручить LLM: подбор инфраструктуры для инференса. Часть 1

Привет, Хабр! Меня зовут Антон, и сейчас я активно занимаюсь вопросами...

29.08.2025 08:01

66

0

ИИ

Оптимизация инференса больших языковых моделей: комплексный анализ современных подходов и практических реализаций

В процессе разработки RAG-системы для обработки видеоконтента передо мной...

11.08.2025 16:10

44

0

ИИ

Где живут LLM: разбираем инференс-кластер YADRO и тестируем его производительность

Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO:...

30.07.2025 08:44

58

0

ИИ

Сравнение двух СнК одного тех. процесса с точки зрения инференса нейронных сетей

Несколько лет назад у меня на прошлой работе состоялась интересная дискуссия с...

02.07.2025 07:15

60

0

Технологии

[Перевод] Что же такое TPU

В последнее время я много работал с TPU и мне было интересно наблюдать такие...

25.06.2025 13:01

69

0

ИИ

[Перевод] Видеокарты для нейросетей: две RTX 5060 Ti 16GB или одна RTX 3090 24GB? Тест LLM‑инференса

Мечтаете запустить нейросеть на компьютере и анализировать целые книги или...

18.06.2025 08:00

70

0

ИИ

Edge AI: локальный инференс — новый драйвер эффективности бизнеса

Привет! Я — Миша Тринога, менеджер по продуктовому маркетингу в Selectel. По...

05.06.2025 08:05

68

0

ИИ

Как готовить Triton: рецепты вашей собственной Inference-платформы

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов...

17.04.2025 12:03

67

0

ИИ

Разработка CLI с помощью пакета Cobra: как не наступить на змею при написании

Привет, Хабр. Меня зовут Иван Добряев, я разработчик программного обеспечения в...

17.04.2025 09:46

74

0