2月10日阿里千问正式发布新一代图像生成模型Qwen-Image-2.0。Qwen-Image-2.0其实在Qwen-Image和Qwen-Image-Edit两大模型基础上进行叠加升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。
下图展示了,从文生图,然后再将图片生成带不同拍照姿势的图组。

Qwen-Image-2.0 的升级能力得到了重大突破,支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令。在AI Arena文生图评测中斩获1029分,位列全球第三,在图片编辑中得分1034,仅次于Nano Banana Pro。

五大核心能力解析
1. 专业级信息还原能力
Qwen-Image-2.0支持高达1K token的超长文字输入,能够精准理解并生成PPT、信息图、数据报表、时间轴等高度结构化内容。测试显示,当输入888个token的提示词时,模型可完整呈现字体样式、字号大小、图文混排等细节,文字错误率较前代降低82%。

2. 超高密度内容承载能力
模型在《兰亭集序》全文渲染测试中表现出色,在保持山水画面完整性的同时,成功呈现98%以上的汉字结构,仅个别笔画存在微小瑕疵。这解决了AI图像生成中长期存在的“文字恐惧症”问题。

3. 意境与排版的高度统一
Qwen-Image-2.0自带美学排版逻辑,文字自动避让画面主体,保证构图和谐。同时支持瘦金体、小楷、行楷等多种书法字体,可将诗词、古文与水墨、工笔画面深度融合,实现真正意义上“诗书画一体”的东方美学表达。

4. 跨介质物理真实感
模型原生支持2K分辨率(2048×2048像素)输出,能够细腻刻画人物肌肤毛孔、织物纹理、建筑结构等微观细节。通过改进光影渲染算法,生成图像的色彩饱和度降低37%,更接近真实摄影效果。

5. 模块化规整排版能力
新模型实现单次生成24格连贯漫画的能力,在医疗流程图、电商商品图等实际应用测试中,展现出强大的主体一致性保持能力。生成的20格分镜漫画中人物特征、画风风格保持高度统一。


免费体验
Qwen-Image-2.0已在阿里云百炼平台开放API邀测,普通用户可通过Qwen Chat:https://chat.qwen.ai/免费体验基础功能。













