近日,美团推出全新多模态统一大模型方案 STAR(STacked AutoRegressive Scheme for Unified Multimodal Learning),凭借创新的 "堆叠自回归架构 + 任务递进训练" 双核心设计,实现了 "理解能力不打折、生成能力达顶尖" 的双重突破。
在 GenEval(文本 - 图像对齐)、DPG-Bench(复杂场景生成)、ImgEdit(图像编辑)等 benchmark 中,STAR 实现了 SOTA 性能;用最简训练逻辑与紧凑模型设计让统一多模态大模型真正走向工业级落地。