扩散模型

技术文章

FreeTalker: 基于扩散模型的可控语音和文本驱动的手势生成 | ICASSP 2024

目前的工作主要基于话语的音频和文本生成共语手势，却忽略了说话者的非语言动作。为了解决这一问题，我们提出了FreeTalker框架，这是目前首个能生成自发（如共语手势）和非自发（如在…

音频技术
2024年1月29日