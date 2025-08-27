大陸科技巨頭阿里巴巴，更新了開源影片生成模型通義萬相「Wan2.2-S2V」，僅需一張靜態圖片和一段音訊，就可生成面部表情自然、口型一致的電影級數位人影片。延續人工智慧（AI）快速升級節奏，以跟上全球競爭對手。

彭博報導，據通義萬相的微信公眾號，這款模型單次生成的影片時長可達分鐘級，大幅提升數位人直播、影視製作、AI教育等行業的影片創作效率。目前，模型已在通義萬相官網上線。

IT之家報導，Wan2.2-S2V 還支持文本控制，輸入Prompt後，還可對影片畫面進行控制，讓影片主體的運動和背景的變化更豐富。

例如，上傳一張人物彈鋼琴的照片、一段歌曲和一段文字，Wan2.2-S2V 即可生成一段完整、聲情並茂的鋼琴演奏影片，不僅能保證人物形象和原圖一致，面部表情和嘴部動作還能與音訊對齊，影片人物的手指手型、力度、速度也能完美匹配音訊節奏。

阿里巴巴表示，自今年2月以來，通義萬相已連續開源文生影片、圖生影片、首尾幀生影片、全能編輯、音訊生影片等多款模型，在開源社區和三方平台的下載量已超過2,000萬。

自大陸初創企業深度求索（DeepSeek）今年登上全球舞台以来，阿里巴巴全面押注AI，但正面臨激烈競爭。美國科技巨頭Alphabet旗下的谷歌、AI初創公司Manus以及快手科技，都在過去幾個月推出了新影片工具或升級版本。

與許多全球科技公司一樣，阿里巴巴在AI上的轉向尚未帶來顯著回報。受大陸消費低迷拖累，阿里巴巴在5月公布的季度營收僅增長7%。