概述

产品简介

ZEGO 实时传译（ZegoRealtimeTranslation），是 ZEGO 携手智能语音行业生态服务商提供的实时语音转写及翻译服务，提供实时语音转写及翻译服务，覆盖主流语种。

通过 SDK 接入后，提供将音频流实时识别成文本并翻译转写成目标语言的服务，达到“边说话边输出文字”等无障碍沟通效果。

注意

当前 ZEGO 实时传译供应商有：谷歌、讯飞等。

当客户开通某个实时传译供应商服务时，系统默认把该供应商的相关服务全部开通。请注意，服务开通不代表收费，实时传译服务 按用量计费，使用前请联系 ZEGO 商务人员咨询。

实时传译支持中文、英语、日语、韩语、法语、西班牙语等多种主流语种，适用于会议实时转写、直播字幕、跨国交流、录音质检、音频内容分析等场景。

实时传译方式	产品功能	描述
实时语音转写	实时语音识别	实时语音云端转文字并回调结果，适用于长句语音输入，支持识别 100 多种语言。
	智能断句	根据语义进行智能断句，输出带有标点的语音识别结果和翻译结果。
	语种自动检测	输入语音中包含多种语言时，能够准确识别目前支持语种，包括：中文、英语、日语、韩语、俄语、法语、西班牙语、德语。
	自动标点	语音识别后的文本可自动添加标点。
实时文本翻译	实时文本翻译	实时将源语言翻译成指定的目标语言。
	文本中间结果翻译	在语音输入过程中即开始翻译，输入结束后，智能优化翻译结果，支持自定义打开或关闭中间结果翻译功能。
	文本翻译频率设置	可以设置文本翻译的频率。

ZEGO 实时传译 SDK 支持 iOS、Android 平台，支持平台间互通，具体的兼容性要求见下表。

平台	SDK	Demo	兼容性
iOS	支持	支持	最低兼容 iOS 11.0
Android	支持	支持	最低兼容 Android 8.0

视频直播字幕

在视频或赛事等直播场景中，支持将音频实时转换成文字，用于实时字幕展示，提升直播体验效果。

实时会议记录

在线上会议、跨国会议、大型展会、宣讲会等各类大小会议场景中，支持将多角色发言人的语音实时转换成文本，提高会议传达效率，降低会议记录编写成本，准确高效输出会议记录。

跨国异地交流

在各种国际多语言线上交流场景中，支持实时展示各角色发言内容并翻译，打破语言交流障碍，让跨国沟通变得更轻松更简单。

智能客服

将通话记录实时转成文字，可以实现智能外呼和实时质检，协助企业分析语音内容，锁定风险语音，提升质检覆盖度。

课堂音频识别

对老师课堂内容实时记录并转换成文本，校方可以进行教学内容记录以及教学质量评估，助力高校教学评估能力建设。

一站式灵活选择，低门槛按需接入

一站式接入科大讯飞、谷歌等行业主流智能语音服务商产品服务，减少单独对接的沟通成本，助力产品快速上线。实时传译支持按需选择，自由搭配使用，灵活切换体验不同语音识别、文本翻译产品效果。

多语种识别，多场景覆盖

覆盖国际常用语种互译，广泛应用于语音转文本提效、跨语种内容生产及分享等社交、办公、娱乐场景。例如，赛事或秀场直播、1v1 交友、IM 私信聊天、会议或视频字幕制作等业务，可满足复杂语言环境的场景需求。

超低延时，快速响应

音频流支持毫秒级识别，可实时生成翻译结果，实现字幕与音画完全同步，且感知无时延，用户体验佳。

语义理解，智能纠错

在返回实时转写结果的同时，通过上下文信息进行语义理解，将中间结果进行智能纠错，并根据语音的内容理解和停顿，智能匹配标点符号，确保识别的高准确率。

精准识别，高效输出

在复杂噪声场景中（如演讲、会议场景），支持精确转写和翻译，中文（普通话）识别率可达 95%。