OpenAI выпустила новую модель o1: Впервые ИИ начал “думать” перед тем, как ответить

Компания OpenAI выпустила новую модель искусственного интеллекта под названием OpenAI o1, созданную для решения сложных задач. Она работает медленнее, чем другие модели компании, зато способна строить логические цепочки и «думать» почти как человек.

“Мы обучили эти модели тратить больше времени на обдумывание проблем, прежде чем они ответят, — подобно тому, как это делает человек. В ходе тренировок они учатся совершенствовать свой мыслительный процесс, пробовать разные стратегии и распознавать свои ошибки”, — говорится в официальном анонсе.

Глава исследовательского направления OpenAI Джерри Творек в комментарии изданию The Verge утверждает, что для обучения модели o1 использовали «совершенно новый алгоритм оптимизации и новый набор обучающих данных, созданный специально для него». Предыдущие ИИ-модели используют в ответах готовые шаблоны, полученные из массивов данных, на которых их обучали. В случае с o1 используется способ «обучения с подкреплением», в рамках которого систему поощряют или наказывают в ходе взаимодействия с внешней средой.

Благодаря этому методу у модели формируется цепочка решений или даже «мыслей», которая используется при обработке запросов. Этот процесс похож на то, как решает проблемы обычный человек. Модель способна не только давать ответы, но и объяснять свои решения. Творек также заметил, что o1 галлюцинирует меньше других продуктов компании, хотя разработчикам пока не удалось полностью избавиться от этой проблемы.

Модель OpenAI o1 пока доступна в превью-версии для пользователей с платной подпиской ChatGPT Plus. Кроме того, разработчики создали более быструю и дешевую версию OpenAI o1-mini, которая лучше всего подходит для задач, связанных с написанием кода. Разработчики отмечают, что она тоже способна строить логические цепочки, но не обладает обширными знаниями о мире, как основная модель.