Впервые после GPT-2 OpenAI выкладывает новые модели с открытым кодом, чтобы сторонние разработчики могли свободно использовать и дообучать их под собственные задачи. Компания планирует собирать обратную связь и проводить презентации для разработчиков по всему миру. Модели распространяются под лицензией Apache 2.0, что снимает юридические ограничения на коммерческое использование и модификацию.
gpt-oss-120b — это крупная модель со 120 млрд параметров, предназначенная для запуска в дата-центрах и на мощных рабочих станциях. gpt-oss-20b — облегченная версия, подходящая для использования на большинстве современных ноутбуков и настольных ПК.
Модели демонстрируют высокие результаты на международных тестах. По данным OpenAI, на проверке MMLU модель гpt-oss-120b набрала 90 баллов, gpt-oss-20b — 85,3. В тесте GPQA Diamond показатели составили 80,1 и 71,5 соответственно. Оба варианта поддерживают работу с длинными цепочками рассуждений и инструментами, такими как веб-поиск и выполнение Python-кода, а также расширенное обучение для решения специализированных задач.
Ранее OpenAI публиковала полностью открытые модели только в 2019 году (GPT-2). Возвращение к open source обусловлено растущей конкуренцией со стороны других производителей ИИ, уже открывших доступ к аналогичным продуктам, а также запросом на прозрачные и безопасные технологии. Компания уверяет, что все открытые модели прошли расширенное тестирование на безопасность и могут использоваться в чувствительных или конфиденциальных проектах.
Модели уже доступны на платформе Hugging Face и поддерживаются на популярных движках vLLM, Ollama и Transformers. OpenAI планирует дополнительно выпускать обучающие материалы и собирать обратную связь от пользователей для совершенствования продуктов.