OpenAI представила модель искусственного интеллекта o1 с уровнем рассуждений доктора наук
Компания OpenAI представила новую серию языковых моделей искусственного интеллекта под названием o1, разработанных специально для улучшения возможностей рассуждения, особенно в сложных вопросах науки, программирования и математики. Компания настолько уверена в этих достижениях, что обнулила счётчик версий модели до единицы, начав заново после GPT-4o, и заметно отошла от бренда GPT.
Первая модель серии o1, получившая название o1-preview, доступна как в ChatGPT, так и в API OpenAI. Несмотря на статус предварительной версии, компания обещает регулярные обновления и улучшения.
Модели o1 были обучены улучшать свой подход к решению задач, тратя больше времени на анализ проблемы, прежде чем предложить ответ. Этот метод позволяет моделям экспериментировать с различными стратегиями, выявлять собственные ошибки и решать сложные задачи более систематичным, человекоподобным способом.
Результаты, представленные OpenAI, свидетельствуют о значительном прогрессе новых моделей o1. По данным компании, эти модели демонстрируют уровень производительности, сравнимый с аспирантами в сложных тестах по физике, химии и биологии.
Например, модель достигла 83% точности в тесте, который позволяет студентам пройти квалификацию на Международную математическую олимпиаду, что является заметным улучшением по сравнению с 13% точностью GPT-4o.
Конечно, тесты искусственного интеллекта иногда могут быть ненадёжными, поэтому истинная производительность моделей o1 станет яснее, когда больше пользователей протестируют их в различных сценариях.
Кроме того, новые модели, похоже, разрешают некоторые давние вопросы, например, количество букв «р» в слове «strawberry» (клубника), наконец-то положив конец мемам. OpenAI также продемонстрировала пример, где модель успешно сгенерировала код Python для аркадной игры, подчеркнув свои передовые возможности.
Помимо повышения возможностей рассуждения, OpenAI также сосредоточилась на усилении защиты от «взлома», метода, используемого для обхода механизмов безопасности. По данным компании, так называемая o1-preview набрала 84 балла из 100 в одном из самых сложных тестов на взлом, по сравнению с 22 баллами у GPT-4o.
Чтобы сделать эти модели более доступными, особенно для разработчиков, OpenAI также выпускает облегчённую версию o1-mini, предназначенную для задач программирования.
Доступ к o1-mini и o1-preview в настоящее время открывается для платных подписок ChatGPT Plus и Teams.