通义千问发布Qwen-Image-Layered模型支持图片分层编辑-A³·爱力方

在人工智能（AI）图像编辑的这场、日益追求“逼真”与“可控”的全球“军备竞赛”中，一场深刻的、关乎“编辑范式”的终极革命，正由中国的科技巨头阿里巴巴，以一款，名为Qwen-Image-Layered的、全新的开源模型，悍然引爆。

在过去，几乎所有AI图片编辑工具，其工作的模式，都更像是一位，传统的“油画大师”。

它，在一个，统一的、扁平的“画布”之上，进行创作。这意味着，你，对画面中，任何一个微小元素的修改，都可能会，不可避免地，“污染”和“破坏”到，其周围的其他区域。

而现在，阿里通义千问的这款新模型，则试图，为AI，装上一个，现代的、属于“数字设计师”的、全新的“大脑”。

其核心，只有一个，却又极具颠覆性：

它，让AI，第一次，真正地，学会了，去理解和使用“图层”（Layers）。

这场，堪称“AI版Photoshop革命”的核心，是一种，被其研发团队，称为“图像解耦”的创新思路。

它，不再，将一张静态的图片，视为一个，不可分割的、整体的像素矩阵。

它，以一种，类似于“剥洋葱”的方式，将其，智能地，自动地，分解为，一系列，在语义上，相互独立的RGBA图层。

这其中，每一个图层，都拥有其，专属的颜色（RGB）与透明度（Alpha）信息，并且，可以被，独立地，进行操作，而完全，不会，影响到，其他的任何一个图层。

“这，彻底地，解决了，当前AI图片编辑，所面临的两大核心痛点，”一位参与内测的设计师向AIbase表示，“无论是，全局编辑时，容易破坏未修改区域一致性的问题；还是，基于掩码（Mask）的局部编辑时，难以处理复杂遮挡和模糊边界的难题。”

这场“图层”革命的背后，是通义千问团队，在模型架构上的两大核心创新。

首先，是其全新的RGBA-VAE技术。它，让传统的RGB图像，与新兴的RGBA图层，能够在同一个、统一的“潜空间”（Latent Space）中，进行“对话”和转换，从而，从根本上，解决了图层分布不均、边界模糊不清的问题。

其次，则是其独特的VLD-MMDiT架构。它，支持，从3层，到10层以上的、灵活的图层处理。并且，层与层之间，通过高效的“注意力机制”，进行协同工作，而无需，再进行，那些，低效的、递归式的拆解。

更值得关注的是，该模型，支持“可变数量”的图层分解。这意味着，同一张图像，可以，根据用户的不同需求，被灵活地，拆分为3个粗颗粒度的图层，或者，8个更精细的图层。并且，其中的任何一个图层，都能够，被进一步地，进行“递归”式的、无限层级的再次分解。

爱力方的分析认为，阿里通义千问的这次，堪称“王炸”级的Qwen-Image-Layered的发布与全面开源，其战略意图，是清晰而极具侵略性的。

它，深刻地，揭示了，在AI的这场“下半场”的竞争中，一个，正在浮现的、全新的“价值战场”。

当AI的“生成”能力，日益变得同质化和“商品化”时，谁，能率先地，在“编辑”这个，更贴近专业工作流、也更具商业价值的环节，建立起自己的技术壁垒，谁就将在这场，关乎“创意生产力”的终极战争中，赢得决定性的、无可匹敌的优势。

它，正在将AI的角色，从一个，只会“画画”的“艺术家”，历史性地，升维为一个，更懂得“解构”与“重组”的“视觉设计师”。
它，也正在，将AI图片编辑的体验，从过去那种，“指东打西”、“靠运气”的“玄学”模式，重塑为一种，“指哪改哪”、“所见即所得”的“精确科学”。

目前，Qwen-Image-Layered的技术报告、代码仓库及在线的Demo，均已，在arXiv、Github、ModelScope和Hugging Face等全球主流的开源平台，同步上线。

当AI，真的，开始，学会，像一个，拥有数十年经验的Photoshop大师一样，去思考和操作“图层”时，一场真正意义上的、深刻的“视觉内容”生产力革命，才算真正地，拉开了序幕。

技术报告:

https://arxiv.org/abs/2512.15603

Github:

https://github.com/QwenLM/Qwen-Image-Layered

ModelScope:

https://www.modelscope.cn/models/Qwen/Qwen-Image-Layered

Hugging Face:

https://huggingface.co/Qwen/Qwen-Image-Layered

Demo:

https://www.modelscope.cn/studios/Qwen/Qwen-Image-Layered

通知

尊敬的用户

user

通义千问发布Qwen-Image-Layered模型支持图片分层编辑

爱力方

相关图文

阿里发布通义千问图像分层编辑模型Qwen-Image-Layered 实现一键生成Photoshop图层

英伟达发布Nemotron 3 混合架构优化AI代理效率

千问App深度整合高德地图，AI提升出行顺路体验

快手AI编程模型KAT-Coder-Pro V1跻身全球榜单前十

迪士尼向谷歌发出版权警告

Meta新AI模型牛油果明年面世蒸馏学习技术引关注

热门资讯

从跑酷到叠衣：机器人行业为何集体放弃“炫技”？

2.2亿用户，115亿美元血亏：OpenAI的“万亿帝国”，是梦想还是泡沫？

从六轴到七轴，不止多一轴：松灵NERO发布，开启机器人精细操作新篇章

破解机器人“触觉智能”终极难题！浙大“活结”技术登《Nature》：一个绳结解锁精准力控

阿里巴巴开源 Z-Image 图像模型：支持中英双语文字渲染

虚拟偶像的“集体舞”有解了！三校联手推出AI编舞模型，一首歌驱动全场

快讯

长安汽车更换总会计师和董秘，张德勇调任中国电气装备集团

美的八年布局跻身全球机器人行业前三

乐聚展厅的战略布局与应对策略

机器人搭载固态心脏：欣界能源量产突破推动技术革新

2026马年春节档透视：机器人从舞台氛围组转向产线实干家

特朗普派福特号航母赴中东，曾参与委内瑞拉袭击；美股AI板块受挫；好莱坞面临"Seedance时刻

香港中文大学任洪亮团队创新人工动觉框架走出视觉依赖桎梏

具身天工3.0推动中国具身智能加速落地

EPFL实现机器人集体续命技术

国地中心联合北理工发布“龙驭”小脑模型实现零样本全身动态动作追踪

推荐专栏

爱力方

机器人大讲堂

下一篇