CreateAgentInstance

2026-03-04

POST

https://aigc-aiagent-api.zegotech.cn/

通过本接口，您可以创建智能体实例，并将智能体实例加入到语音（RTC）对话之中。

注意

如果创建智能体实例的用户超过 120 秒（可通过 AdvancedConfig.MaxIdleTime 参数自定义）不在 RTC 房间内，则智能体实例会自动销毁，并触发 Event 为 AgentInstanceDeleted 的回调，Data.Code 为 1202。
默认情况下一个账号下最多同时存在 10 个智能体实例，超过限制后创建智能体实例会失败，如需调整请联系 ZEGO 商务。

Request

Query Parameters

Action string必填

可选值: [CreateAgentInstance]

接口原型参数

https://aigc-aiagent-api.zegotech.cn?Action=CreateAgentInstance

AppId uint32必填

💡公共参数。应用 Id，由 ZEGO 分配的用户唯一凭证。可从 ZEGO 控制台获取。

SignatureNonce string必填

💡公共参数。16 位 16 进制随机字符串（8 字节随机数的 hex 编码）。生成算法可参考签名示例。

Timestamp int64必填

💡公共参数。当前 Unix 时间戳，单位为秒。生成算法可参考签名示例，最多允许 10 分钟的误差。

Signature string必填

💡公共参数。签名，用于验证请求的合法性。请参考签名机制生成。

SignatureVersion string必填

可选值: [2.0]

默认值: 2.0

💡公共参数。签名版本号。

application/json

Body

required

AgentId string必填

已注册的智能体唯一标识符

UserId string必填

可选值: <= 32 characters

与该 AI Agent 实例交互的真实用户 ID。仅支持数字、英文字符、'-'、'_'。

RTC objectrequired

RTC 相关信息

📌 重要说明

所有属性字符限制：仅支持数字、英文字符、'_'、'-'、'.'。

RoomId string必填

可选值: <= 128 characters

RTC 房间 ID。

AgentStreamId string必填

可选值: <= 128 characters

智能体实例推流使用的流 ID。

📌 重要说明

请确保当前运行中的多个智能体实例（即便不在同一个 RTC 房间）使用不同的流 ID，否则会导致后创建的智能体实例推流失败。

AgentUserId string必填

可选值: <= 32 characters

智能体实例的用户 ID。

📌 重要说明

需确保同时在运行中的多个智能体实例（即便不在同一个 RTC 房间）使用不同的用户 ID，否则先创建的智能体实例会被踢出 RTC 房间。

UserStreamId string必填

可选值: <= 128 characters

真实用户推流使用的流 ID。

LLM object

Vendor string

可选值: [OpenAIChat, OpenAIResponses]

默认值: OpenAIChat

LLM 接口的供应商类别。

OpenAIChat：OpenAI 的 Chat Completions 接口类型。
OpenAIResponses：OpenAI 的 Responses API 接口类型。

Url string必填

接收请求的端点（可以是你自己的服务，也可以是任何 LLM 服务提供商提供的服务）。如果 Vendor 为 OpenAIChat ，则必须兼容 OpenAI Chat Completions API。例如：https://api.openai.com/v1/chat/completions

如果 Vendor 为 OpenAIResponses ，则必须兼容 OpenAI Responses API。例如：https://ark.cn-beijing.volces.com/api/v3/responses

📌 重要说明

如果 ApiKey 设置为 "zego_test"，则必须使用以下 Url 地址之一：

MiniMax：https://api.minimax.chat/v1/text/chatcompletion_v2

火山引擎（豆包）：https://ark.cn-beijing.volces.com/api/v3/chat/completions

阿里云百炼（通义千问）：https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions

阶跃星辰：https://api.stepfun.com/v1/chat/completions

ApiKey string

LLM 服务提供商用于认证的参数。默认为空，但在生产环境中必须提供。

📌 重要说明

在接入测试期间(AI Agent 服务开通 2 周内)，可以将该参数值设置为 "zego_test" 即可使用该服务。

Model string必填

LLM 模型。不同的 LLM 服务提供商支持不同的模型，请参考其官方文档选择合适的模型。

📌 重要说明

如果 ApiKey 设置为 "zego_test"，则必须使用以下模型之一：

MiniMax：

MiniMax-Text-01

火山引擎（豆包）：

doubao-1-5-pro-32k-250115

doubao-1-5-lite-32k-250115

阿里云百炼（通义千问）：

qwen-plus

阶跃星辰：

step-2-16k

SystemPrompt string

智能体系统提示（prompt）。调用 LLM 时附加在最前的预定义信息，用于控制 LLM 输出。可以是角色设定、提示词和回答样例等。

Temperature number

可选值: >= 0 and <= 2

默认值: 0.7

数值越高，输出越随机；数值越低，输出越集中和确定。

TopP number

可选值: >= 0 and <= 1

默认值: 0.9

采样方法，数值越小，确定性越强；数值越大，随机性越强。

Params object

LLM 服务提供商支持的其他参数，如最大 Token 数量限制等。不同的 LLM 提供商支持不同的参数，请参考其官方文档并根据需要填写。

AddAgentInfo boolean

默认值: false

如果此值为 true，AI Agent 服务器在请求 LLM 服务时会在请求参数中包含智能体信息（agent_info）。包含的智能体信息数示例请参考使用自定义 LLM。您可以使用此参数在自定义 LLM 服务中执行额外的业务逻辑。

agent_info 的结构如下：

room_id: 房间 ID
user_id: 用户 ID
agent_instance_id: 智能体实例 ID

📌 重要说明：仅在 Vendor 为 "OpenAIChat" 时有效。

AgentExtraInfo object

Agent 扩展信息，服务器在请求 LLM 服务时会在请求参数中透传该参数。透传参数示例请参考使用自定义 LLM。您可以使用此参数在自定义 LLM 服务中执行额外的业务逻辑。📌 重要说明：仅在 Vendor 为 "OpenAIChat" 时有效。

key string

额外信息键。

value

额外信息值，可以是任意类型。

TTS object

Vendor string必填

可选值: [Aliyun, ByteDance, ByteDanceV3, ByteDanceFlowing, MiniMax, CosyVoice]

语音合成（TTS）服务提供商。详细请参考配置 TTS > TTS 参数说明

Params objectrequired

TTS 配置参数，格式为 JSON 对象。包含 app 参数（用于认证）和其他参数（用于调整 TTS 效果）。详细请参考配置 TTS > Params 参数说明

app object必填

用于 TTS 服务鉴权，不同的 Vendor 值要求传入的 app 参数的结构不同，详细请参考配置 TTS > Params 参数说明

other_params string

📌 重要说明

other_params 不是一个有效参数，仅仅是为了说明如何透传厂商参数。除 app 参数外，其余参数均直接透传厂商参数。详细请参考配置 TTS > Params 参数说明

FilterText object[]

从输入给 TTS 的内容中（一般是 LLM 返回的内容或者 SendAgentInstanceTTS 接口的 Text 参数值）过滤掉指定标点符号内的文本，然后再进行语音合成。比如把“(开心的说)即构科技欢迎你！”括号内的内容过滤掉，再进行语音合成。

说明

- 通常是在 LLM > SystemPrompt 中通过提示词的方式指引 LLM 哪些内容应该放在指定标点符号内。
- 此参数在更新智能体实例时无法更新。

Array[

BeginCharacters string必填

过滤文本的开始标点符号。例如，如果要过滤 () 中的内容，请设置为 (。

EndCharacters string必填

过滤文本的结束标点符号。例如，如果要过滤 () 中的内容，请设置为 )。

]

TerminatorText string

可选值: <= 4 characters

可用于设置 TTS 的终止文本。若输入给 TTS 的内容中（一般是 LLM 返回的内容或者 SendAgentInstanceTTS 接口的 Text 参数值）出现匹配 TerminatorText 字符串的内容，则本轮 TTS 从 TerminatorText 字符串（包含）开始的内容将不再进行语音合成。

📌 重要说明

双向流式只能设置一个字符。

通常是在 LLM > SystemPrompt 中通过提示词的方式指引 LLM 哪些内容应该放在指定标点符号内。

此参数在更新智能体实例时无法更新。

CharacterFilter string[]

输入给 TTS 的内容中（一般是 LLM 返回的内容或者 SendAgentInstanceTTS 接口的 Text 参数值）指定的字符串不参与语音合成。数组内每个字符串代表一个要被过滤掉的字符串，每个字符串不超过 2 个字符。

ASR object

Vendor string

可选值: [Tencent, AliyunParaformer, AliyunGummy, Microsoft]

默认值: Tencent

ASR 厂商。可参考配置 ASR 参数说明。

Params object

厂商参数，具体使用方式参考配置 ASR 中的 Params 参数说明。

VADSilenceSegmentation number

可选值: >= 200 and <= 2000

默认值: 500

用于设置用户说话停顿多少秒后，不再将两句话视为一句。单位为 ms，范围 [200，2000]，默认为 500。详细说明请参考语音识别断句。

📌 重要说明

当 Vendor 为 "Tencent" （默认）时，最大值为 1500。

PauseInterval number

可选值: >= 200 and <= 2000

用于设置用户说话停顿多少秒内，将两句话视为一句，即 ASR 多句拼接。单位为 ms，范围 [200，2000]。仅当此值大于 VADSilenceSegmentation 时，才会启用 ASR 多句拼接。详细说明请参考语音识别断句。

VADSensitiveLevel int

可选值: [0, 1, 2, 3]

默认值: 0

VAD 敏感度，0：中等敏感度,默认值；1：低敏感度；2：高敏感度；3：自定义模式,需配合 VADMinSpeechDur 和 VADEnergyThreshold 使用。详细说明请参考语音打断灵敏度调整。

VADMinSpeechDur int

可选值: >= 0 and <= 1000

VAD 最小说话时长，单位 ms，值越大，越不容易误检，但是可能会引起有些短语音漏检，取值范围[0, 1000]。

VADEnergyThreshold float

可选值: >= 0 and <= 1

VAD 能量阈值，值越小，灵敏度越高，取值范围[0, 1]。

HotWord string已废弃

该参数已废弃。请通过 Params 厂商参数设置。

MessageHistory object

供智能体实例使用的历史消息的配置

SyncMode integer

可选值: [0, 1]

默认值: 0

消息同步模式：

0: 从即时通讯 (ZIM) 同步
1: 通过 Messages 参数同步

Messages object[]

Possible values: <= 100

消息列表

Array[

Role string必填

可选值: [user, assistant]

消息发送者的角色

user: 用户
assistant: 智能体

Content string必填

消息内容

]

WindowSize Int

可选值: >= 0 and <= 500

默认值: 20

每次调用 LLM 服务时使用的近期历史消息数量。影响 LLM 上下文理解能力，建议设置为 10-30。

ZIM object

ZIM 相关信息。

📌 重要说明

- 仅当 MessageHistory.SyncMode 为 0 时有效。

- 请确保您的项目已开通 ZIM 服务。

- 请确保已调用 ZIM 机器人注册接口，并将返回的 UserInfo.UserId 作为 RobotId。

- 建议您提前注册机器人，以便完善用户信息设置并提升智能体实例的创建效率。

RobotId string

ZIM 机器人 ID。即调用 ZIM 注册机器人接口对应的 UserInfo.UserId 。用于加载用户与该 ZIM 机器人的聊天上下文，并将对话过程中产生的消息同步至 ZIM。如果此参数为空，实时互动 AI Agent 后台将随机生成。

LoadMessageCount integer

可选值: >= 0 and <= 500

创建智能体实例时，从 ZIM 服务获取多少条消息作为上下文。默认为 WindowSize 的值（取值上限）。

CallbackConfig object

服务端回调配置

📌 重要说明

在配置以下参数前，你需要参考接收回调设置好回调地址，并了解具体字段说明。

ASRResult integer

可选值: [0, 1]

默认值: 0

是否开启服务端回调 ASR 结果。

LLMResult integer

可选值: [0, 1]

默认值: 0

是否开启服务端回调 LLM 结果。如果开启，则 ZEGO 服务端将会按照每句话返回 LLM 输出结果。

Interrupted integer

可选值: [0, 1]

默认值: 0

是否开启服务端回调智能体被打断结果。

UserSpeakAction integer

可选值: [0, 1]

默认值: 0

是否开启服务端回调用户说话的回调。

AgentInstanceStatus integer

可选值: [0, 1]

默认值: 0

是否开启服务端回调智能体实例状态的回调。

UserAudioData integer

可选值: [0, 1]

默认值: 0

是否开启服务端回调用户说话音频数据。

AdvancedConfig object

InterruptMode integer

可选值: [0, 1]

默认值: 0

智能体说话时被用户语音打断的模式：

0: 立即打断。如果在 AI 说话时用户说话，那么 AI 将被立刻打断，停止说话。
1: 不打断。如果在 AI 说话时用户说话，那么 AI 不会被影响直到内容说完。

MaxIdleTime integer

可选值: >= 10 and <= 1800

默认值: 120

智能体实例的自动销毁时间。创建实例的用户（UserId）若超过 MaxIdleTime 不在 RTC 房间内，则智能体实例会自动销毁，并触发 Event 为 AgentInstanceDeleted 的回调，Data.Code 为 1202。默认为 120s，取值范围 [10, 1800]。

DisableTTS boolean

默认值: false

是否禁用 TTS 功能。如果设置为 true，则智能体实例不会进行语音合成。

📌 重要说明

DisableTTS 为 true 时，调用创建数字人智能体实例及主动调用 TTS接口都会报错。

CommunicationMode integer

可选值: [0, 2]

默认值: 0

互动模式：

0：全双工模式。用户随时可以说话。
2：对讲机模式。麦克风默认关闭，并按需调用接口开启。明确用户开始说话和结束说话的时间。

LLMMetaInfo object

用于控制从 LLM 输出文本中提取用作额外控制参数的元数据。元数据应该为一个 JSON 对象，通常通过 LLM.SystemPrompt 参数控制 LLM 按照指定格式输出内容。具体元数据 JSON 对象格式根据功能要求有所不同。示例用法及更多说明可参考控制智能体语音情绪。

BeginCharacters string

标记元数据在文本中的起始符号。即该符号开始往后，直到遇到 EndCharacters 符号为止，中间的内容为元数据。不可为空或纯空格，注意不要使用常见字符及分句符号。

EndCharacters string

标记元数据在文本中的结束符号。即该符号开始往前，直到遇到 BeginCharacters 符号为止，中间的内容为元数据。不可为空或纯空格，注意不要使用常见字符及分句符号。

SendMetaKeys string[]

指定 MetaInfo 中发送 key 的范围，比如：["emotion", "action"]

📌 重要说明

只有此范围的 key 和 value，才会通过房间信令或者回调给业务方发送消息。消息类别：

房间消息 Cmd = 102

服务端回调 "AgentInstanceMetaInfo"

Responses

创建成功

application/json

数据结构
按数据结构生成的示例

Schema

Code integer

返回码，0 表示成功，其他值表示失败。详情请参考返回码说明。

Message string

请求结果说明

RequestId string

请求 ID

Data object

AgentInstanceId string

智能体实例的唯一标识。

{
  "Code": 0,
  "Message": "Success",
  "RequestId": "3151527792559699732",
  "Data": {
    "AgentInstanceId": "1912122918452641792"
  }
}

{
  "Code": 0,
  "Message": "Success",
  "RequestId": "3151527792559699732",
  "Data": {
    "AgentInstanceId": "1912122918452641792"
  }
}

CreateAgentInstance

https://aigc-aiagent-api.zegotech.cn/

Request

Query Parameters

Body

Responses​

Responses