logo
当前页

智能体参数说明

本文档所列参数被用在注册智能体更新智能体创建智能体实例更新智能体实例等多个接口中。

LLM

参数类型是否必选描述
UrlString接收请求的端点 (可以是您自己的服务,也可以是任意 LLM 服务供应商提供的服务),需与 OpenAI Chat Completions API 兼容。
比如:https://api.openai.com/v1/chat/completions
ApiKeyStringLLM 服务供应商用于鉴权的参数。默认为空,生产环境中务必传入。
ModelStringLLM 模型。不同的 LLM 服务供应商支持的模型各异,请参考其官网文档选择合适的模型。
SystemPromptString智能体系统提示(prompt)。调用 LLM 时附加在最前的预定义信息,用于控制 LLM 输出。可以是角色设定、提示词和回答样例等。
TemperatureFloat较高的值将使输出更加随机,而较低的值将使输出更加集中和确定。
TopPFloat采样方法,数值越小结果确定性越强;数值越大,结果越随机。
ParamsObjectLLM 服务供应商支持的其他参数,例如最大 Token 数限制等。不同的 LLM 供应商支持的参数各异,请参考其官网文档按需填入。
Params 示例
"Params": {
    "max_tokens": 1024
}
1
Copied!

TTS

参数类型是否必选描述
VendorString文本转语音(TTS)服务供应商。可选:
  • Aliyun:阿里云。
  • ByteDance:火山引擎(大模型语音合成 API)。
  • ByteDanceFlowing:火山引擎(双向流式 API)。
  • MiniMax:MiniMax。
ParamsObjectTTS 配置参数,格式为 JSON 对象。详情请参考 Params
FilterTextArray of Object

将 LLM 返回内容中指定标点符号中的文字过滤后,再进行语音合成。本参数结构,请参考 FilterText

说明

Params

Params 中包含 app 参数和其他参数。

  • app 参数:用于鉴权,详情请参考 app 参数说明
  • 其他参数:用于调整 TTS 效果。传入内容会直接透传给 TTS 服务提供商。

app 参数说明

app 参数用于 TTS 服务鉴权,不同的 Vendor 值要求传入的 app 参数的结构各异,请参考下文。

其他参数说明

您可以根据 Vendor的值,参考如下服务提供商的官方文档获取所需信息:

示例

Aliyun
ByteDance
ByteDanceFlowing
MiniMax
"TTS": {
    "Vendor": "Aliyun",
    "Params": {
        "app":{
            "app_key": "your key",
            "ak_id": "your ak id",
            "ak_key": "your ak key"
        },
        "voice": "zhitian_emo"
    }
}
1
Copied!
/*
    cluster 配置支持以下: 
          volcano_tts:(默认)普通音色的集群
          volcano_mega: 声音复刻大模型 1.0
          volcano_icl:声音复刻大模型 2.0

    ⚠️注意:voice_type 和 cluster 要匹配
*/

"TTS": {
    "Vendor": "ByteDance",
    "Params": {
        "app": {
            "appid": "your_appid",
            "token": "your_token",
            "cluster": "volcano_tts"
        },
        "audio": {
            "voice_type": "your_voice_type"
        }
    }
}
1
Copied!
/*
    resource_id 配置支持以下: 
       volc.service_type.10029:(默认)火山大模型语音合成
       volc.megatts.default:声音复刻2.0(小时版)
       volc.megatts.concurr:声音复刻2.0(并发版) 
    ⚠️(不支持声音复刻1.0)
    ⚠️注意:speaker(音色 ID)和 resource_id 要匹配
*/

"TTS": {
    "Vendor": "ByteDanceFlowing",
    "Params": {
        "app": {
            "appid": "your appid",
            "token": "your token",
            "resource_id": "volc.service_type.10029"
        },
        "req_params": {
            "speaker": "zh_female_qingxinnvsheng_mars_bigtts" // 音色 ID
        }
    }
}
1
Copied!
"TTS": {
    "Vendor": "MiniMax",
    "Params": {
        "app": {
            "group_id": "your_group_id",
            "api_key":  "your_api_key",
        },
        "model": "speech-02-turbo-preview",
        "voice_setting": {
            "voice_id": "male-qn-qingse"
        }
    }
}
1
Copied!

FilterText

参数类型是否必选描述
BeginCharactersString过滤文本的开始标点符号。如要过滤 () 中的内容,则此处设置为 (
EndCharactersString过滤文本的结束标点符号。如要过滤 () 中的内容,则此处设置为 )
Untitled
"FilterText": [
    {
        "BeginCharacters": "(",
        "EndCharacters": ")"
    },
    {
        "BeginCharacters": "(",
        "EndCharacters": ")"
    }
]
1
Copied!

ASR

参数类型是否必选描述
HotWordString热词表,用于提升识别准确率。格式:热词1|权重1,热词2|权重2,热词3|权重3

单个热词不超过 30 个字符(最多 10 个汉字),不能包含空格,权重范围:[-1, 11]。

最多支持 128 个热词。
说明
当权重为 11 时,表示该词为超级热词。建议仅将重要且必须生效的热词设置到 11,过多权重为 11 的热词会影响识别效果。

请参考配置语音识别热词了解详细使用方法
ParamsObject扩展参数,详情请联系 ZEGO 技术支持。
VADSilenceSegmentationNumber用于设置用户说话停顿多少秒后,不再将两句话视为一句。单位为 ms,范围 [200,2000],默认为 500。
请参考语音识别断句了解详细使用方法。
PauseIntervalNumber用于设置用户说话停顿多少秒内,将两句话视为一句,即 ASR 多句拼接。单位为 ms,范围 [200,2000]。仅当此值大于 VADSilenceSegmentation,才会开启 ASR 多句拼接。
请参考语音识别断句了解详细使用方法。
Untitled
"ASR": {
    "HotWord": "历史类|10,物理类|10,体育类|10"
}
1
Copied!

Agents

参数类型描述
AgentIdString智能体的唯一标识。
NameString智能体名称。
LLMObject大语言模型参数。本参数结构,请见本文 LLM
TTSObject文本转语音参数。本参数结构,请见本文 TTS
ASRObject语音识别参数。本参数结构,请见本文 ASR

Previous

返回码

Next

注册智能体