实时互动 AI Agent

产品简介

下载 SDK 及 Demo

快速开始

快速发起语音通话

实现数字人视频通话

实现数字人实时播报

连接至 ZEGO 文档 MCP 服务

基础功能

客户端

智能体自定义控制

AI主动说话：主动调用 LLM 或 TTS

展示用户和智能体实例状态

获取智能体状态及延迟数据

打断智能体

高级功能

最佳实践

API 参考

在线调试服务端 API

智能体配置管理

智能体实例管理

智能体实例控制

回调

智能体应用克隆音色

2026-06-02

在与智能体进行实时语音互动对话时，可以将智能体的音色切换为期望的音色，例如某个用户的声音。只需录制秒级别的目标人物声音，即可即时完成对人物音色、说话风格、口音和声学环境音的复刻。

音色克隆属于增值能力，计费方式请参考：TTS 定价说明。

说明

目前支持火山引擎、MiniMax、阿里等多家厂商的声音复刻及文本转语音能力。

前提条件

已经参考快速开始接入 AI Agent 服务。
请联系技术支持开通TTS（文字转语音/语音合成/声音克隆）服务（需要选定所需厂商），并获取相关子账号或API鉴权信息等。

使用步骤

1

按各厂商指引克隆音色

2

在语音对话中使用克隆的音色

在注册Agent智能体（RegisterAgent）或创建智能体实例（CreateAgentInstance）时，设置 TTS 结构体中填写Params字段，该字段将透传给第三方 TTS 的接口，其中就包括音色信息：

MiniMax：填写 voice_id
火山引擎：填写 speaker

MiniMax

// Minimax，voice_id 填写为使用克隆的音色
"TTS": {
    "Vendor": "MiniMax",
    "Params": {
        "app": {
// !mark(1:2)
            "group_id": "your_group_id",
            "api_key":  "your_api_key"
        },
        "model": "speech-02-turbo",
        "voice_setting": {
// !mark
            "voice_id": "clone_voice_id"
        }
    }
}

// Minimax，voice_id 填写为使用克隆的音色
"TTS": {
    "Vendor": "MiniMax",
    "Params": {
        "app": {
// !mark(1:2)
            "group_id": "your_group_id",
            "api_key":  "your_api_key"
        },
        "model": "speech-02-turbo",
        "voice_setting": {
// !mark
            "voice_id": "clone_voice_id"
        }
    }
}

当前页

智能体应用克隆音色

返回到顶部