Новости по тегу "большие языковые модели"

Подборка публикаций, содержащих тег "большие языковые модели". Актуальные темы и важные события.

Нет изображения

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого...

29.06.2025 08:57
29
Нет изображения

Автоматическая поддержка пользователей на парах Вопрос-Ответ

Автоматическая поддержка пользователей становится все более и более популярной. Довольно часто распространена ситуация, когда на сайте есть раздел...

26.06.2025 07:00
27
Нет изображения

Как устроены LLM-агенты: архитектура, планирование и инструменты

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат...

12.06.2025 08:07
30
Нет изображения

[Перевод] Как я нашёл уязвимость в ядре Linux при помощи модели o3

В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь...

27.05.2025 14:15
30
Нет изображения

[Перевод] Возвращаюсь к работе мозгом после месяцев кодинга с LLM

TLDR: LLM неплохо справляются с кодингом, но в больших проектах они пишут запутанный сумбур. Я уменьшил объём использования ИИ при кодинге и...

20.05.2025 07:36
30
Нет изображения

Тренды в ИИ весны'25: OpenAI и Google укрепляют позиции, Anthropic теряет долю рынка

Какие ИИ-модели набирают популярность, а кто теряет доверие пользователей? Весной 2025-го платформа Poe раскрывает неожиданные повороты в гонке...

18.05.2025 12:44
31
Нет изображения

Leaderboard Illusion: что не так с Chatbot Arena

Опубликованная 29 апреля научная работа Leaderboard Illusion подставила под сомнение прозрачность и объективность рейтинговых механизмов Chatbot...

01.05.2025 15:48
44
Нет изображения

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР

Бенчмарк Vending-Bench шведского стартапа Andon Labs — это тест для больших языковых моделей, проверяющий их способность к долгосрочному...

28.04.2025 09:48
42
Нет изображения

[Перевод] Руководство Google по промпт-инжинирингу. Заключительная часть: лучшие практики и рекомендации

В завершающей части руководства от Google мы фокусируемся на лучших практиках и тонкостях мастерства промпт-инжиниринга. Изучаем все аспекты...

19.04.2025 11:22
41
Нет изображения

Накорми языковую модель документами

Одна из актуальных задач для компаний в сфере ИИ - это поиск и генерация ответов по внутренней документации. На первый взгляд кажется, что решение...

19.04.2025 11:20
47