OpenAI выпустила новую флагманскую модель генерации изображений в ChatGPT, которая доступна всем пользователям, включая тех, у кого нет подписки. Модель работает до четырёх раз быстрее и лучше понимает запросы при создании и редактировании изображений.
Об этом сообщила OpenAI.
Новая версия ChatGPT Images была запущена сегодня для всех пользователей ChatGPT, а также стала доступна через API под названием GPT Image 1.5. Модель позволяет создавать изображения с нуля или редактировать загруженные фотографии, точно изменяя только те элементы, которые указал пользователь, при этом сохраняя освещение, композицию и внешний вид людей.
В OpenAI отмечают, что модель значительно улучшила способность следовать инструкциям, работать с текстом на изображениях, выполнять сложные правки — добавление, удаление, комбинирование и трансформацию элементов — и создавать более естественные результаты, в том числе при генерации множества лиц и мелких деталей. Кроме того, в ChatGPT появился отдельный раздел Images с готовыми стилями, фильтрами и шаблонами для быстрого создания визуального контента.
Новая модель отличается от Sora, другой разработки OpenAI, по своему назначению и уровню доступности. ChatGPT Images ориентирована прежде всего на создание и редактирование статичных изображений прямо в чате и доступна широкой аудитории, в том числе бесплатно, с определёнными ограничениями. Sora же является более мощной мультимодальной моделью, разработанной для сложной работы с различными типами контента, включая видео, и на данный момент не имеет такого же массового доступа, как генерация изображений в ChatGPT.
В OpenAI подчеркнули, что, несмотря на заметный прогресс по сравнению с предыдущей версией, результаты работы модели всё ещё не идеальны, и компания планирует дальнейшие улучшения в будущих обновлениях.