DreamTalk是一个基于扩散模型的音频驱动表达性头部生成框架,核心功能是将静态人物照片转化为逼真、富有表现力的说话视频。
DreamTalk是一款由清华大学、阿里巴巴集团和华中科技大学联合开发的创新人工智能技术,专注于通过扩散模型将人物照片转化为具有动态说话效果的虚拟形象。该项目的核心目标是创建一个框架,使人物头像能够模仿不同声音,实现逼真的虚拟角色表情和动作,适用于影视制作和人机交互场景。
Δ