(2025.12.17,新加坡)昨日,中国科技巨头阿里巴巴集团近日发布了其新一代人工智能视频生成模型——万相2.6系列。此次升级被官方称为面向专业影视制作与图像创作场景的“全面进化”,并特别强调其新增的“角色扮演”功能为国内首创。

根据阿里巴巴发布的信息,通义万相2.6模型在画质、音效、对用户指令的精确理解与执行等方面均实现了显著提升。该模型单次生成的视频时长最高可达15秒,为目前国内同类模型的领先水平。目前,它能整合音画同步、多镜头生成、声音驱动以及全新的角色扮演与分镜控制等多项能力,被官方誉为“全球功能最全的视频生成模型”。
阿里巴巴在新闻材料中详细解释了其技术核心。据悉,万相2.6能够对用户输入的参考视频进行深度的多模态联合分析与学习,不仅捕捉画面中主体的情绪、姿态、多角度视觉特征,还能提取声音中的音色、语速等关键声学特征。在生成新视频时,这些学习到的特征将作为控制条件,确保从画面到声音的“全感官一致性”得以在生成内容中迁移和保持。这一技术使得模型能够支持单人与多人场景的逼真“表演”转换。
对于专业创作至关重要的叙事与镜头语言,万相2.6展示了其独特的理解能力。模型可以通过对用户输入提示的高层语义解析,自动构建具有完整故事线和叙事张力的多镜头段落。在实现多个镜头之间流畅切换的同时,它能确保核心主体、场景布局与环境氛围的统一性,维持整段视频在内容、节奏与风格上的高度连贯。这一功能被期待能直接应用于广告创意设计、短剧制作等专业领域。
新推出的“角色扮演”功能则提供了前所未有的创意娱乐体验。用户只需上传一段个人视频,并输入如“科幻悬疑风格”等创意提示,万相2.6便能自动完成分镜设计、将用户形象融入新角色进行演绎,并同步生成匹配的画面配音,最终产出一段拥有电影级运镜感的短片,让普通人也能在AI构建的影视场景中过一把“演员瘾”。
阿里巴巴表示,万相2.6模型已同步在阿里云百炼平台及万相官方网站上线。即日起,公众可直接通过官网体验其最新功能,企业用户则可通过阿里云百炼平台调用模型API,将其集成到自身的业务流程中。此外,该模型也预计将于近期在阿里巴巴旗下的千问APP中上线,并提供更丰富的互动玩法。










































