Новости по тегу "Vllm"
Подборка публикаций, содержащих тег "Vllm". Актуальные темы и важные события.
Животные
Когда данные говорят на разных языках: как LongCat-Flash-Omni объединяет текст, звук и видео
Автор: Денис Аветисян Очередной "прорыв", конечно. 560 миллиардов параметров,...
ИИ
Где живут LLM: разбираем инференс-кластер YADRO и тестируем его производительность
Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO:...
ИИ
Эффективный инференс множества LoRA адаптеров
LoRA — популярный метод дообучения больших моделей на небольших датасетах,...
ИИ
Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster
Продолжаем пошагово разбираться с ответом на вопрос о том, как эффективно...