Новости по тегу "Vllm"

Подборка публикаций, содержащих тег "Vllm". Актуальные темы и важные события.

Новости Vllm - актуальные события на Toplenta
Животные

Когда данные говорят на разных языках: как LongCat-Flash-Omni объединяет текст, звук и видео

Автор: Денис Аветисян Очередной "прорыв", конечно. 560 миллиардов параметров,...

04.11.2025 16:05
1
Новости Vllm - актуальные события на Toplenta
ИИ

Эффективный инференс множества LoRA адаптеров

LoRA — популярный метод дообучения больших моделей на небольших датасетах,...

27.06.2025 08:19
42
Новости Vllm - актуальные события на Toplenta
ИИ

Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster

Продолжаем пошагово разбираться с ответом на вопрос о том, как эффективно...

14.05.2025 08:00
50