Новости по тегу "галлюцинации"
Подборка публикаций, содержащих тег "галлюцинации". Актуальные темы и важные события.

Project Vend: может ли языковая модель продавать чипсы и вольфрам?
В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого...

Лидер «Смысловых галлюцинаций» завершит фестиваль Ural Music Night
Лидер рок-группы «Смысловые галлюцинации» Сергей Бобунец станет хедлайнером главной акции музыкального фестиваля Ural Music Night. Смотр пройдет в...

Когда ИИ тестирует лучше тебя: ищу баги в OWASP Juice Shop с помощью Cypress и Workik
Тестирую уязвимое приложение с ИИ и Cypress: практика на OWASP Juice Shop. Генерирую тест-кейсы, запускаю автотесты, оформляю баг-репорты и...

Где ИИ врёт и как с этим жить — мой гайд после фейлов
Устал от багов нейросети. Решил разобраться в алгоритмах ИИ-галлюцинаций, как они влияют на работу, и в конце оставил гайд с рекомендациями по...

Как я не дал ИИ сойти с ума: гайд по промптам и багам
ИИ часто выдумывает вместо того, чтобы проверять. В статье — почему нейросети галлюцинируют, примеры «дорогих» ошибок, и промпты для тех, кто...

Галлюцинации моделей текстовых ИИ, и как с ними бороться
Современные языковые модели, такие как ChatGPT, Claude, Gemini, Grok и так далее, способны генерировать тексты, которые часто кажутся уверенными,...

AI-агенты в реальном мире: почему они не работают и как это исправить
AI-агенты часто не оправдывают ожиданий при внедрении в реальные продукты. Разбираемся, почему сложно оценивать их эффективность, какие...

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР
Бенчмарк Vending-Bench шведского стартапа Andon Labs — это тест для больших языковых моделей, проверяющий их способность к долгосрочному...

[Перевод] Когда ИИ становится троянским конем: 43% «галлюцинированных» имен пакетов регулярно повторяются в сгенерированном коде
AI-помощники регулярно "галлюцинируют" несуществующие пакеты, а злоумышленники используют эти имена для размещения вредоносного кода в...