logo
当前页

配置翻译

2026-02-28

功能介绍

在实时语音识别(ASR)过程中,您可以开启翻译功能,将识别到的音频内容实时翻译成目标语言。

  • 该功能支持以下两种主要的配置模式:
    • 房间维度翻译:房间内所有流共用一套翻译配置。
    • 流维度翻译:为房间内不同的流设置个性化的翻译配置(如不同的目标语言)。
  • 目前支持的翻译模型包括:doubao-seed-translation、Qwen-MT 等。对应不同模型支持的翻译语种,请分别参考对应的模型的官方文档。
  • 支持获取翻译结果的方式:
    • 服务端回调获取翻译结果。
    • 实时音视频房间信令(ZEGO Express SDK)回调。

核心参数配置

创建实时语音识别任务(StartRealtimeASRTask)时配置参数。

参数类型是否必选描述
RoomIdStringRTC 房间 Id
RecognitionRangeInt识别返回。0: 整个房间,1: 指定 StreamList
StreamListarray of object需要识别的流列表,RecognitionRange 为 1 时生效。
EnableTranslationBool是否开启翻译
TranslationObject翻译 LLM 配置项
SubtitleTypeInt字幕通过房间信令下发类型:
  • 0: 不下发
  • 1: 仅下发识别结果
  • 2: 下发翻译结果
  • 3: 下发识别结果和翻译结果
若需要客户端UI展示字幕,则建议配置为 23

使用示例

前提条件

  1. 使用 ZEGO 云端实时语音识别支持的翻译模型
  2. 已经自行开通翻译服务,并获取了模型的 API Key。

开启带翻译的识别任务,并在客户端展示翻译结果

获取翻译结果

通过服务端获取翻译结果(非流式)

参考接受回调文档,获取 EventTranslationResultData 结果.

(可选)客户端展示字幕

显示翻译字幕,请参考展示字幕文档。

上一篇

展示字幕

下一篇

调用方式

当前页

返回到顶部