Alibaba выпустила открытую модель генерации изображений Qwen-Image-2512 под лицензией Apache 2.0 31 декабря 2025 года, создав альтернативу проприетарной Gemini 3 Pro Image от Google для локального развертывания. Предприятия получили инструмент для контроля над данными и затратами без потери качества визуализации — критичный фактор в условиях растущих требований к технологическому суверенитету.
Разработчики получают полный доступ к модели через Hugging Face, ModelScope и GitHub с весами и исходным кодом. Лицензия Apache 2.0 разрешает коммерческое использование, модификацию и дообучение без ограничений. Управляемый API через Alibaba Cloud Model Studio стоит $0,075 (≈5,90 ₽) за изображение после исчерпания бесплатной квоты. Демо-версии работают без установки на Hugging Face, ModelScope и в Qwen Chat для быстрого тестирования возможностей.
Компании устраняют зависимость от внешнего поставщика при генерации визуального контента с текстом. Локальное развертывание модели на собственной инфраструктуре обеспечивает контроль резидентности данных и позволяет амортизировать затраты вместо платежей за использование API. Ритейлеры генерируют карточки товаров с текстом на китайском и английском языках без орфографических ошибок. Корпорации адаптируют модель под региональные языки, отраслевую специфику и внутренние стандарты визуальной коммуникации.
Модель точно встраивает текст в инфографику и передает реализм портретов для корпоративных материалов. Система генерирует слайды, постеры и визуализации с читаемым текстом и согласованными макетами по запросам на естественном языке. Портреты передают возраст, текстуры кожи и мимику без характерного искусственного вида, свойственного ранним open-source моделям. Текстуры материалов, ландшафты и поверхности детализированы для использования в электронной коммерции, образовательном контенте и технической документации.
В слепом тестировании AI Arena от Alibaba модель заняла четвертое место среди всех систем и первое среди открытых решений в более чем 10 000 раундов сравнения с оценкой людьми. Результаты подтверждают производственный уровень точности рендеринга текста, реализма изображений и согласованности макетов — три категории, где проприетарная Gemini 3 Pro Image установила новый отраслевой стандарт в ноябре 2025 года.
Выбор между открытым и проприетарным решением теперь определяется инфраструктурой и политикой управления данными, а не качеством генерации. Компании оценивают стоимость самостоятельного развертывания с инженерными ресурсами против удобства API-доступа с платежами за использование. Открытый исходный код позволяет дообучение на корпоративных данных под отраслевую специфику без нарушения лицензионных ограничений. Qwen-Image-2512 требует инженерных компетенций для развертывания, но возвращает организациям полный контроль над процессом генерации визуального контента и хранением конфиденциальных данных.





