DreamTalk 是一个使用扩散概率模型生成表情动作的框架。它包含了三个关键组件:降噪网络、风格感知的嘴唇专家和风格预测器。通过扩散概率模型,DreamTalk 能够有效生成具有多样化表达风格的逼真说话人脸,并减少对昂贵的风格参考的依赖。它能够生成具有多种语言和表情风格的照片级说话人脸。
最热网址