ZEGO 实时传译(ZegoRealtimeTranslation),是 ZEGO 携手智能语音行业生态服务商提供的实时语音转写及翻译服务,通过 SDK 接入后,提供将音频流实时识别成文本并翻译转写成目标语言的服务,达到“边说话边输出文字”等无障碍沟通效果。实时传译支持中文、英语、日语、韩语、法语、西班牙语等多种主流语种,适用于会议实时转写、直播字幕、跨国交流、录音质检、音频内容分析等场景。
实时传译产品架构
实时传译功能特性
实时传译方式 | 产品功能 | 描述 |
实时语音转写 | 实时语音识别 | 实时语音云端转文字并回调结果,适用于长句语音输入,支持识别 100 多种语言。 |
智能断句 | 根据语义进行智能断句,输出带有标点的语音识别结果和翻译结果。 | |
语种自动检测 | 输入语音中包含多种语言时,能够准确识别目前支持语种,包括:中文、英语、日语、韩语、俄语、法语、西班牙语、德语。 | |
自动标点 | 语音识别后的文本可自动添加标点。 | |
实时文本翻译 | 实时文本翻译 | 实时将源语言翻译成指定的目标语言。 |
文本中间结果翻译 | 在语音输入过程中即开始翻译,输入结束后,智能优化翻译结果,支持自定义打开或关闭中间结果翻译功能。 | |
文本翻译频率设置 | 可以设置文本翻译的频率。 |
平台兼容
ZEGO 实时传译 SDK 支持 iOS、Android 平台,支持平台间互通,具体的兼容性要求见下表。
平台 | SDK | Demo | 兼容性 |
---|---|---|---|
iOS | 支持 | 支持 | 最低兼容 iOS 11.0 |
Android | 支持 | 支持 | 最低兼容 Android 8.0 |
支持说明
应用场景
视频直播字幕
在视频或赛事等直播场景中,支持将音频实时转换成文字,用于实时字幕展示,提升直播体验效果。
实时会议记录
在线上会议、跨国会议、大型展会、宣讲会等各类大小会议场景中,支持将多角色发言人的语音实时转换成文本,提高会议传达效率,降低会议记录编写成本,准确高效输出会议记录。
跨国异地交流
在各种国际多语言线上交流场景中,支持实时展示各角色发言内容并翻译,打破语言交流障碍,让跨国沟通变得更轻松更简单。
智能客服
将通话记录实时转成文字,可以实现智能外呼和实时质检,协助企业分析语音内容,锁定风险语音,提升质检覆盖度。
课堂音频识别
对老师课堂内容实时记录并转换成文本,校方可以进行教学内容记录以及教学质量评估,助力高校教学评估能力建设。
产品优势
一站式灵活选择,低门槛按需接入
一站式接入科大讯飞、谷歌等行业主流智能语音服务商产品服务,减少单独对接的沟通成本,助力产品快速上线。实时传译支持按需选择,自由搭配使用,灵活切换体验不同语音识别、文本翻译产品效果。
多语种识别,多场景覆盖
覆盖国际常用语种互译,广泛应用于语音转文本提效、跨语种内容生产及分享等社交、办公、娱乐场景。例如,赛事或秀场直播、1v1 交友、IM 私信聊天、会议或视频字幕制作等业务,可满足复杂语言环境的场景需求。
超低延时,快速响应
音频流支持毫秒级识别,可实时生成翻译结果,实现字幕与音画完全同步,且感知无时延,用户体验佳。
语义理解,智能纠错
在返回实时转写结果的同时,通过上下文信息进行语义理解,将中间结果进行智能纠错,并根据语音的内容理解和停顿,智能匹配标点符号,确保识别的高准确率。
精准识别,高效输出
在复杂噪声场景中(如演讲、会议场景),支持精确转写和翻译,中文(普通话)识别率可达 95%。
本文为原创稿件,版权归作者所有,如需转载,请注明出处:https://www.nxrte.com/jishu/24304.html