logo
当前页

StartRealtimeASRTask

2026-01-23
POST

https://cloud-realtime-asr-api.zegotech.cn/

开启云端实时语音识别任务,并把语音识别实例加入 RTC 对话中。

Request

Query Parameters

    Action string必填

    可选值: [StartRealtimeASRTask]

    接口原型参数

    https://cloud-realtime-asr-api.zegotech.cn?Action=StartRealtimeASRTask

    AppId uint32必填

    💡公共参数。应用 Id,由 ZEGO 分配的用户唯一凭证。可从 ZEGO 控制台 获取。

    SignatureNonce string必填

    💡公共参数。16 位 16 进制随机字符串(8 字节随机数的 hex 编码)。生成算法可参考 签名示例

    Timestamp int64必填

    💡公共参数。当前 Unix 时间戳,单位为秒。生成算法可参考 签名示例,最多允许 10 分钟的误差。

    SignatureVersion string必填

    可选值: [2.0]

    默认值: 2.0

    💡公共参数。签名版本号。

    Signature string必填

    💡公共参数。签名,用于验证请求的合法性。请参考签名机制生成。

Body

required
    RoomId string必填

    RTC 房间 Id

    RecognitionRange integer

    可选值: [0, 1]

    识别范围。0:房间内所有流,1:指定 StreamList。

    ASR object
    ASR 参数
    Vendor string

    可选值: [Tencent, AliyunParaformer, AliyunGummy, Microsoft]

    默认值: Tencent

    ASR 厂商。可参考配置 ASR 参数说明。若需要阿里、微软识别厂商,请联系 ZEGO 商务开通。

    Params object

    厂商参数,具体使用方式参考配置 ASR 中的 Params 参数说明。

    VADSilenceSegmentation number

    可选值: >= 200 and <= 2000

    默认值: 500

    用于设置用户说话停顿多少秒后,不再将两句话视为一句。 单位为 ms,范围 [200,2000],默认为 500。 详细说明请参考配置 ASR - 断句识别

    HotWord string已废弃

    该参数已废弃。请通过 Params 厂商参数设置。

    StreamList object[]
    需要识别的流列表,RecognitionRange 参数为 1 时生效。当 RecognitionRange 参数为 1 该参数不能为空。
  • Array[
  • StreamId string必填

    需要识别的流 ID。

  • ]
  • AdvancedConfig object
    高级配置参数。
    MaxIdleTime integer

    可选值: >= 30 and <= 1800

    默认值: 120

    RTC 房间内超过 MaxIdleTime 没有真实用户,后台自动停止识别任务,单位为秒。

    EnableTranslation boolean

    是否开启翻译。默认不开启。

    Translation object
    翻译 LLM 配置项
    Vendor string必填

    可选值: [DoubaoSeedTranslation, QwenMT]

    调用 LLM 供应商。

    SourceLanguage string必填

    源语言

    TargetLanguage string必填

    目标语言

    LLM objectrequired
    用于翻译的 LLM 参数。
    Url string必填

    调用 LLM 接口地址。不同 Vendor 不同:

    • Vendor 为 DoubaoSeedTranslation 时:https://ark.cn-beijing.volces.com/api/v3/responses
    • Vendor 为 QwenMT 时:https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
    ApiKey string

    LLM 校验 api key,默认为空,生产环境中建议填写。阿里百炼等应用平台填写其 api key。

    Model string必填

    所调用的 LLM 模型名称,必填。不同供应商支持的模型不同。

    Params object

    LLM 或应用平台的请求参数,选填。

    • 对于 OpenAI 协议,可配置如 max_tokens, temperature, stream 等参数。
    • 对于其他应用平台,可填写平台支持的参数。
    SubtitleType integer

    可选值: [0, 1, 2, 3]

    字幕下发类型。0: 不下发, 1: 仅下发识别结果, 2: 下发翻译结果,3: 下发识别结果和翻译结果

Responses

开始任务成功
Schema
    Code integer

    返回码,0 表示成功,其他值表示失败。详情请参考 返回码 说明。

    Message string

    请求结果说明

    RequestId string

    请求 ID

    Data object
    TaskId string

    任务的唯一标识。

上一篇

返回码

下一篇

停止云端实时语音识别

当前页

返回到顶部