配置 ASR

功能简介

为了提高不同场景下语音识别（或语音转文字）的识别准确率，可以通过以下方式实现：

目前腾讯为默认开通并支持的语音识别厂商。若需要阿里、微软等识别厂商，请联系 ZEGO 商务开通。

在创建实时语音识别任务（StartRealtimeASRTask）时可以通过 ASR 参数设置需要使用的厂商、语种、热词等参数。

参数	类型	是否必选	描述
Vendor	String	否	ASR 供应商，默认为 Tencent： Tencent: 腾讯 AliyunParaformer: 阿里云 Paraformer AliyunGummy: 阿里云 Gummy Microsoft: 微软 ASR
~~HotWord~~	String	否	该参数已废弃。请通过 Params 扩展参数设置，具体使用方式参考下面各厂商的热词设置说明。
Params	Object	否	厂商参数，具体使用方式参考下面各厂商的参数设置说明。
VADSilenceSegmentation	number	否	用于设置用户说话停顿多少毫秒后，不再将两句话视为一句。范围 [200，2000]，默认为 500。详细说明请参考断句识别。

各厂商的 Params 参数说明如下：

判断用户是否说话结束可由 VADSilenceSegmentation 参数影响。

配置	问答结果
VADSilenceSegmentation = 500ms	用户被判断为说了 2 句话：第1句：今天天气真好啊。我想出去玩第2句：你呢？说明由于400ms < VADSilenceSegmentation 所以前两段记作第1句；800ms > VADSilenceSegmentation所以第三段被记作独立的第 2 句。

说明

若您不知道哪一个效果更好，推荐使用场景 1 配置。

场景	VADSilenceSegmentation
场景1:需要尽快获得识别结果。用于展示字幕等。	500ms
场景2:希望尽量准确地识别结果，可以接受一定的延迟。例如实时总结。	1000ms