OpenAI возвращается к open-source: обзор моделей GPT-OSS-120b и GPT-OSS-20b

Компания OpenAI, известная разработкой топовых языковых моделей, сделала важный шаг навстречу открытому сообществу, представив две передовые open-source модели — GPT-OSS-120b и GPT-OSS-20b. Этот релиз знаменует возвращение компании к изначальной идее открытого распространения своих технологий (или, скорее, является пиар-ходом компании в ответ на упреки в закрытости). Событие действительно знаковое, ведь впервые с момента выпуска GPT-2 в 2019 году компания делает веса своих крупных языковых моделей полностью доступными сообществу.

В статье мы подробно рассмотрим технические особенности этих моделей, их архитектуру и механизмы работы, результаты на основных бенчмарках, аспекты безопасности и лицензионную политику. Материал основан на официальной документации OpenAI, а также на подробной информации из репозитория на GitHub и публикациях на платформе Hugging Face.

Читать далее
5