合成实时流式数字人视频

简介

本文介绍如何基于服务端 API 快速实现合成实时流式视频。

说明

流式数字人视频生成与推流需要与实时音视频搭配使用。

前提条件

在合成实时流式视频前，请确保：

在 ZEGO 控制台创建项目，并申请有效的 AppID，详情请参考控制台 - 项目管理 - 项目信息。
已联系 ZEGO 技术支持开通数字人 API 服务和相关接口的权限。
已获取数字人 ID 和音色 ID，详情请参考查询数字人资产。
您的项目已集成实时音视频 SDK。

实现流程

1 生成签名

根据调用方式的签名机制生成签名，签名需设置在下文请求的公共参数中，ZEGO 服务端在收到请求后将对签名进行验证，以校验请求方的合法性。

2 获取可用的数字人列表

调用查询数字人列表获取可用的数字人。

3 获取可用的音色列表

调用查询音色列表获取音色。

4 创建数字人视频流任务

调用创建数字人视频流任务创建一个数字人视频流任务，生成数字人实时画面。

5 获取数字人视频流任务状态

调用获取数字人视频流任务状态获取数字人视频流任务状态，如果状态为 3：推流中 则表示任务已经正在运行，客户端可以进入房间拉取到数字人的视频流。

6 驱动数字人说话

通过文本、音频、RTC 音频流或 Web Socket 接口，驱动数字人说话。

7 停止数字人视频流任务

调用停止数字人视频流任务停止数字人视频流任务。

当前页

合成实时流式数字人视频

2 获取可用的数字人列表

3 获取可用的音色列表

4 创建数字人视频流任务

5 获取数字人视频流任务状态

6 驱动数字人说话

7 停止数字人视频流任务

返回到顶部