文章来源于互联网:真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
EMO 最初由阿里巴巴通义实验室提出,作为音频驱动高表现力人像 AI 视频生成的先驱。现在,该实验室的研究者带来了升级版本「EMO2」!
只需提供一张人物的肖像图片,你就可以输入任意长度的音频来驱动人物说话、唱歌或进行手势舞。并且,生成的人物表情和动作都具备高度的感染力和专业水准。
-
论文标题:EMO2: End-Effector Guided Audio-Driven Avatar Video Generation
-
论文地址:https://arxiv.org/abs/2501.10687
-
项目地址:https://humanaigc.github.io/emote-portrait-alive-2/





文章来源于互联网:真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准







