Новости по тегу "LLM"
Подборка публикаций, содержащих тег "LLM". Актуальные темы и важные события.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса
Ян Лекун, один из крёстных отцов современного ИИ, в своём твиттере резко критикует корпоративных исследователей ИИ, которые ведут проприетарные...

Юнит тесты роя агентов
🐝 Тестирование роя агентовЮнит тесты - единственный способ принять работу промпт инженера, так как не понятно, действительно ли он всё это время...

ChatGPT, выполняем запретный запрос — метод калибровки анализа
В этой статье рассмотрю как выполнить даже очень «красный» запрос, настолько красный, что даже сам запрос удаляется системой и заменяется плашкой...

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно
Каждый, кто работал с большими языковыми моделями (LLM), знает про ограничение длины контекста: модель не может напрямую обработать текст,...

Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито
Привет! Я Сергей Кляхандлер, senior DS-инженер в команде LLM Авито. В статье рассказываю, как мы разработали ML-модель, которая автоматически...

OLMo: (Миниатюрная) Открытая Языковая Модель
OLMo — моделька от AI2, разработанная учёными для учёных. Если вы занимаетесь экспериментами над нейронками, это идеальный вариант: весь код и...

ИИ-агенты против живых юзеров: кто лучше тестирует интерфейсы?
Представьте: вы хотите протестировать новую кнопку «Купить», но для статистически значимых выводов нужны тысячи пользователей и недели анализа. А...

[Перевод] Claude лучшая модель?
Данные OpenRouter показывают тенденцию: разработчики охотно платят за Claude, несмотря на наличие бесплатных альтернатив от Google. При создании...

Взлом системного промпта ИИ (ChatGPT\Gemini etc)
Наверное первая притягательная цель для любого исследователя llm является системный промпт. Не так просто может быть даже получить его, а уж тем...

[Перевод] Инструменты, задачи, рассуждения: как понять, на что способен твой LLM-агент
LLM-агенты — отстой. Я провёл последнюю неделю, разрабатывая LLM-агента с возможностью веб-краулинга, используя популярный Python-фреймворк, чтобы...

VideoGameBench: 20 рандомных ретро-игр против нейросети — кто кого?
Языковые модели уже решают олимпиады и пишут код «на лету», так что пора бы им рулить и в Dark Souls… но (спойлер): первые же пиксели экшена...

Оптические нейроморфные процессоры. Посмотрим в будущее
Сначала я хотел написать обычную научно-популярную статью об оптических нейропроцессорах, которые являются самой передовой технологией на пути...