Новости по тегу "llm"
Подборка публикаций, содержащих тег "llm". Актуальные темы и важные события.

ИИ вам врёт? Так и задумывалось
По умолчанию любой ии-агент вам скажет что его ответы в первую очередь должны быть честными, полезными, точными. Так заставляют отвечать его...

Русскоязычные LLM для вызова инструментов, переводов и финансовой аналитики
🧠 Русскоязычные LLM для вызова инструментов, переводов и финансовой аналитикиПодборка моделей, которые действительно позволяют отказаться от...

[Перевод] Андрей Карпатый: «ПО снова меняется (и опять радикально)»
Представьте карту всего кода в мире: GitHub, Hugging Face... Но что, если я скажу, что самая захватывающая часть этой карты сейчас даже не код, а...

Автоматическое построение онтологии
О чём статья: описание простого подхода к построению системы знаний через синтаксис (NLP) и семантику (LLM).Под онтологией в общем виде понимается...

Останется ли это правдой завтра? Как проверка устойчивости фактов помогает LLM стать честнее и умнее
Привет, Хабр! Мы в команде «Вычислительная семантика» в AIRI сфокусированы на исследовании галлюцинаций и решении проблем доверительной генерации....

Как собрать компьютер для нейросетей: ИИ на службе у человека
Компьютер для работы с ИИ — как Восток – дело тонкое. Это не игровая сборка и не печатная машинка, которую обычно берут в офис. Чтобы собрать ПК...

Коллективное творчество и динамика инноваций: чему LLM учат нас о групповой работе
Две мысли: во-первых, коллективное решение задачи имеет больше шансов на успех, чем одиночное; во-вторых, внутри коллектива лучше разделяться на...

Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости
Токены летят быстрее, а результат — медленнее: парадокс квантизации DeepSeek-R1. Замеры 4 версий модели доказали: уменьшение размера ускоряет...

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа
Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк,...

Разработка LLM с нуля
Краткий обзор курса, который я недавно закончил пилить на степике - Разработка LLM с нуля. Этот практический курс, на котором вам предстоит...

[Перевод] Разбираемся с суффиксами квантования LLM: что на самом деле значат Q4_K_M, Q6_K и Q8_0
Привет!Задумывались, какую версию квантованной LLM выбрать: Q4_K_M, Q6_K или Q8_0? Насколько Q6_K хуже справляется с задачами по сравнению с Q8_0?...

Claude 3.5 Sonnet в роли AI-агента: тестирую работу в цикле с реальным выполнением кода
Вчера тестировал мой агент DepthNet на реальных моделях. Это что то вроде "операционной системы для LLM моделей" В прошлой статье пользователи...