Новости по тегу "LLM"

Подборка публикаций, содержащих тег "LLM". Актуальные темы и важные события.

Нет изображения

Юнит тесты роя агентов

🐝 Тестирование роя агентовЮнит тесты - единственный способ принять работу промпт инженера, так как не понятно, действительно ли он всё это время...

04.05.2025 10:44
24
Нет изображения

ChatGPT, выполняем запретный запрос — метод калибровки анализа

В этой статье рассмотрю как выполнить даже очень «красный» запрос, настолько красный, что даже сам запрос удаляется системой и заменяется плашкой...

03.05.2025 19:25
26
Нет изображения

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно

Каждый, кто работал с большими языковыми моделями (LLM), знает про ограничение длины контекста: модель не может напрямую обработать текст,...

03.05.2025 10:42
24
Нет изображения

Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито

Привет! Я Сергей Кляхандлер, senior DS-инженер в команде LLM Авито. В статье рассказываю, как мы разработали ML-модель, которая автоматически...

02.05.2025 15:18
26
Нет изображения

OLMo: (Миниатюрная) Открытая Языковая Модель

OLMo — моделька от AI2, разработанная учёными для учёных. Если вы занимаетесь экспериментами над нейронками, это идеальный вариант: весь код и...

02.05.2025 14:00
29
Нет изображения

ИИ-агенты против живых юзеров: кто лучше тестирует интерфейсы?

Представьте: вы хотите протестировать новую кнопку «Купить», но для статистически значимых выводов нужны тысячи пользователей и недели анализа. А...

02.05.2025 11:53
26
Нет изображения

[Перевод] Claude лучшая модель?

Данные OpenRouter показывают тенденцию: разработчики охотно платят за Claude, несмотря на наличие бесплатных альтернатив от Google. При создании...

02.05.2025 07:00
28
Нет изображения

Взлом системного промпта ИИ (ChatGPT\Gemini etc)

Наверное первая притягательная цель для любого исследователя llm является системный промпт. Не так просто может быть даже получить его, а уж тем...

01.05.2025 17:42
27
Нет изображения

[Перевод] Инструменты, задачи, рассуждения: как понять, на что способен твой LLM-агент

LLM-агенты — отстой. Я провёл последнюю неделю, разрабатывая LLM-агента с возможностью веб-краулинга, используя популярный Python-фреймворк, чтобы...

01.05.2025 11:00
27
Нет изображения

VideoGameBench: 20 рандомных ретро-игр против нейросети — кто кого?

Языковые модели уже решают олимпиады и пишут код «на лету», так что пора бы им рулить и в Dark Souls… но (спойлер): первые же пиксели экшена...

30.04.2025 13:33
24
Нет изображения

Оптические нейроморфные процессоры. Посмотрим в будущее

Сначала я хотел написать обычную научно-популярную статью об оптических нейропроцессорах, которые являются самой передовой технологией на пути...

30.04.2025 09:11
24