语音转换
-
Kyutai 发布 Hibiki:一款 27 亿 S2ST 和语音转文本翻译产品,具有接近人类水平的音质和语音转换功能
实时语音翻译是一项复杂的挑战,需要无缝集成语音识别、机器翻译和文本转语音合成。传统的级联方法通常会引入复合错误,无法保留说话者身份,并且处理速度缓慢,因此不太适合现场翻译等实时应用…
-
Vec-Tok-VC+: 双重训练策略下基于渐进式损失约束和残差增强的鲁棒零样本语音转换 | INTERSPEECH2024
零样本语音转换 (zero-shot voice conversion) 旨在保留语言内容的同时,将源说话人语音转换成任意目标说话人的语音。随着深度学习技术的引入,零样本语音转换技…
-
基于多任务学习的保留背景音的语音转换 | ICASSP2023
在影视、有声书内容中,背景音是一种表现丰富的艺术形式。语音转换(Voice Conversion)如能将源说话人语音转换成目标说话人语音的同时,保留源语音中的背景音,将会提供更沉浸…