[Перевод] Всё про инференс на Sophon NPU

В этой статье мы поговорим про ML на базе плат Sophon. Наверное это один из производителей которые набрали больше всего популярнсти в AI последнее время. 

Я расскажу как они соотносятся с другими платами на рынке (Jetson, RockChip, Hailo, TI, etc.). Расскажу как подготовить сети для работы на платформах, покажу ограничения (что пока нельзя сделать, ограничения по скорости, и.т.д.).

Читать далее

📌 Похожие новости

Нет изображения

Попросил ChatGPT-4o и ChatGPT-5 помочь вкатиться в ML. Да они же одинаковые, Наташ

Все считают 5-ю версию лучше, выше, сильнее. Но есть ли разница для обычного пользователя, который...

29.10.2025 08:51
Нет изображения

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB,...

29.10.2025 08:18
Нет изображения

Мир после трансформеров: закат и новый рассвет больших языковых моделей

Даже если вы избегали ChatGPT и его многочисленных аналогов, то наверняка сталкивались с обработкой...

29.10.2025 08:00
Нет изображения

Длинное мышление против жёстких пайплайнов: как DeepAgent превращает рассуждение в действие

Почему ИИ-агенты в реальных задачах за пределами академических экспериментов до сих пор часто...

28.10.2025 13:54
Нет изображения

Объяснимые нейросети (XAI): почему ИИ должен быть прозрачным?

Всем привет. Сегодня хочу затронуть важную и интересную тему объясняемых нейросетей (XAI). «Почему...

30.08.2025 08:05
Нет изображения

SONAR-LLM — учим нейросети думать предложениями вместо слов

Привет, Хабр. Меня зовут Никита Драгунов, я из команды «Интерпретируемый ИИ» лаборатории...

29.08.2025 13:46