OpenAI випустила нову модель o1: Уперше ШІ почав “думати” перед тим, як відповісти

Компанія OpenAI випустила нову модель штучного інтелекту під назвою OpenAI o1, створену для вирішення складних завдань. Вона працює повільніше, ніж інші моделі компанії, зате здатна будувати логічні ланцюжки і “думати” майже як людина.

“Ми навчили ці моделі витрачати більше часу на обдумування проблем, перш ніж вони дадуть відповідь, – подібно до того, як це робить людина. Під час тренувань вони вчаться вдосконалювати свій розумовий процес, пробувати різні стратегії і розпізнавати свої помилки”, – йдеться в офіційному анонсі.

Глава дослідницького напряму OpenAI Джеррі Творек у коментарі виданню The Verge стверджує, що для навчання моделі o1 використовували “абсолютно новий алгоритм оптимізації і новий набір навчальних даних, створений спеціально для нього”. Попередні ШІ-моделі використовують у відповідях готові шаблони, отримані з масивів даних, на яких їх навчали. У випадку з o1 використовується спосіб “навчання з підкріпленням”, у рамках якого систему заохочують або карають під час взаємодії із зовнішнім середовищем.

Завдяки цьому методу в моделі формується ланцюжок рішень або навіть “думок”, який використовується під час обробки запитів. Цей процес схожий на те, як вирішує проблеми звичайна людина. Модель здатна не тільки давати відповіді, а й пояснювати свої рішення. Творек також зауважив, що o1 галюцинує (згенерована штучним інтелектом відповідь, яка містить неправдиву або оманливу інформацію) менше за інші продукти компанії, хоча розробникам поки що не вдалося повністю позбутися цієї проблеми.

Модель OpenAI o1 поки доступна в превью-версії для користувачів із платною підпискою ChatGPT Plus. Крім того, розробники створили швидшу і дешевшу версію OpenAI o1-mini, яка найкраще підходить для завдань, пов’язаних із написанням коду. Розробники зазначають, що вона теж здатна будувати логічні ланцюжки, але не володіє великими знаннями про світ, як основна модель.