В сети 5 апреля появились первые публичные упоминания GPT Image 2, новой нейросети от OpenAI для генерации изображений, замеченной на платформе Chatbot Arena. Модель пока не анонсирована официально, но уже демонстрирует заметный прогресс в качестве генерации.
На платформе Chatbot Arena нейросеть фигурировала под кодовыми названиями maskingtape-alpha, gaffertape-alpha и packingtape-alpha. Судя по первым демонстрациям, ИИ особенно уверенно справляется с пользовательскими интерфейсами, игровыми сценами и генерирует фотореалистичные кадры, включая изображения людей. Система умеет обрабатывать текст, наложенный на изображения, функция, которая традиционно вызывала сложности у аналогов.
Тестирование выявило неточности в фактологическом содержании. На схеме человеческого тела ИИ добавил несуществующие анатомические элементы, а при генерации карты мира название страны Нигер превратилось в Ciger из-за работы встроенных фильтров. Подобные случаи показывают, что разработчикам предстоит искать баланс между модерацией контента и фактологической точностью.
Первая итерация GPT Image 1.5 была представлена ранее и задала базовый уровень качества. Новая версия демонстрирует существенное улучшение в детализации и реалистичности изображений.
Воспользоваться GPT Image 2 напрямую сейчас невозможно, модель уже удалена с арены. Официальный анонс от OpenAI пока не состоялся, дата релиза неизвестна. В России доступны альтернативные решения для генерации изображений, такие как Kandinsky и Shedevrum.






-2.webp&w=3840&q=70)




-2.webp&w=3840&q=70)







