OpenAI o3

Материал из DZWIKI
Перейти к навигации Перейти к поиску
o3
Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).
Ошибка Lua в Модуль:Wikidata на строке 288: attempt to index field 'wikibase' (a nil value).
Тип Генеративная предварительно обученная трансформерная модель
Автор Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).
Разработчик OpenAI
Первый выпуск 31 января 2025 года
Последняя версия Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).
Кандидат в релизы Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).
Бета-версия Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).
Альфа-версия Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).
Тестовая версия Ошибка Lua в Модуль:Wikidata на строке 1098: attempt to index field 'wikibase' (a nil value).

OpenAI o3 — это генеративная предварительно обученная трансформерная модель (GPT), разработанная OpenAI в качестве преемника OpenAI o1. Она предназначена для того, чтобы уделять дополнительное время обдумыванию при ответах на вопросы, требующие пошагового логического рассуждения[1][2]. Полная версия была выпущена для пользователей ChatGPT 31 января 2025 года[3].

История

Модель OpenAI o3 была анонсирована 20 декабря 2024 года, при этом обозначение «o3» было выбрано для избежания конфликта с товарным знаком мобильного оператора O2. Модель доступна в двух версиях: o3 и o3-mini. OpenAI пригласила исследователей в области безопасности и защиты для подачи заявок на ранний доступ к этим моделям до 10 января 2025 года[1][4]. 31 января 2025 года OpenAI выпустила o3-mini для всех пользователей ChatGPT (включая бесплатный тариф) и пользователей API. Также была выпущена более мощная модель — o3-mini-high[5].

Возможности

Для обучения o3 перед генерацией ответов использовалось обучение с подкреплением, при этом применялся подход, который OpenAI называет «частной цепочкой рассуждений». Этот метод позволяет модели планировать наперёд и последовательно обрабатывать задачи, выполняя серию промежуточных этапов рассуждения для помощи в решении проблемы, что требует дополнительных вычислительных ресурсов и увеличивает задержку ответов[6].

Модель o3 демонстрирует значительно лучшие результаты по сравнению с o1 при выполнении сложных задач, включая программирование, математику и науки. OpenAI сообщила, что o3 набрала 87,7 % по тесту GPQA Diamond, который включает вопросы по науке экспертного уровня, недоступные в открытом доступе[7].

На SWE-bench Verified — бенчмарке по программной инженерии, оценивающем способность решать реальные проблемы с GitHub, o3 набрала 71,7 %, тогда как o1 — 48,9 %. На платформе Codeforces o3 набрала 2727 баллов по рейтингу Эло, в то время как o1 – 1891 балл[7].

На бенчмарке Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), оценивающем способность ИИ решать новые, сложные задачи по логике и освоению навыков, точность o3 оказалась в три раза выше, чем у o1[1][8].

См. также

Примечания

  1. 1,0 1,1 1,2 Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills (en-US) // Wired. — ISSN 1059-1028.
  2. Metz. OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems. The New York Times (20 декабря 2024).
  3. Warren, Tom OpenAI launches new o3-mini reasoning model with a free ChatGPT version (амер. англ.). The Verge (31 января 2025). Дата обращения: 2 февраля 2025.
  4. Early access for safety testing. OpenAI (20 декабря 2024).
  5. Franzen. It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise (амер. англ.). VentureBeat (31 января 2025). Дата обращения: 1 февраля 2025.
  6. Zeff; Wiggers, Kyle OpenAI announces new o3 models (амер. англ.). TechCrunch (20 декабря 2024). Дата обращения: 22 декабря 2024.
  7. 7,0 7,1 Franzen; David, Emilia OpenAI confirms new frontier models o3 and o3-mini (амер. англ.). VentureBeat (20 декабря 2024). Дата обращения: 26 декабря 2024.
  8. Hsu. OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI (амер. англ.). New Scientist (20 декабря 2024). Дата обращения: 22 декабря 2024.

Ссылки

Шаблон:OpenAI