主动调用 LLM 和 TTS

大语言模型 ( LLM ) 本身并不支持主动输出，需要通过开发者基于一定规则主动触发智能体说话，从而提升实时互动中的沉浸感。例如当用户5s中没有说话，则让智能体主动通过文本转语音 ( TTS ) 说一句话等。

AI Agent 主动说话的方式：

主动调用 LLM

您可以调用 SendAgentInstanceLLM 接口，主动让 LLM 输出文本和语音。

调用 SendAgentInstanceLLM 时 AI Agent 服务端会拼接一个上下文，这个上下文由 3 部分组成：

调用本接口传入的文本信息及 LLM 生成的回复会被记录在会话消息历史之中，作为上下文输入给 LLM，同时这些消息还会通过 RTC 房间消息下发。

接口参数如下：

参数	类型	是否必选	描述
AgentInstanceId	String	是	智能体实例的唯一标识，通过创建智能体实例接口的响应参数获取。
Text	String	是	发送给 LLM 服务的文本内容。
SystemPrompt	String	否	本次对话的临时智能体系统提示词。如果不填则使用注册智能体或者创建智能体实例时的 LLM 参数中的 `SystemPrompt`。

请求示例如下：

Untitled

{
    "AgentInstanceId": "1907755175297171456",
    "Text": "今天天气怎么样？"
}

Copied!

您可以通过调用 SendAgentInstanceTTS 接口，主动让智能体用语音说一段文本内容。

调用本接口传入的文本消息，会被记录在会话消息历史之中，作为上下文输入给 LLM，同时该消息还会通过 RTC 房间消息下发。

接口参数如下：

参数	类型	是否必选	描述
AgentInstanceId	String	是	智能体实例的唯一标识，通过创建智能体实例接口的响应参数获取。
Text	String	是	用于 TTS 的文本内容，最大不超过 300 个字符。

请求示例如下：

Untitled

{
    "AgentInstanceId": "1907780504753553408",
    "Text": "你好呀，欢迎使用 ZEGO AI Agent 服务。"
}

Copied!