文档中心
aigc_server 数字人 PaaS 服务
文档中心
体验 App
SDK 中心
API 中心
常见问题
代码市场
进入控制台
立即注册
登录
中文站 English
  • 文档中心
  • 数字人 PaaS 服务
  • 产品简介
  • 概述

概述

更新时间:2024-07-09 15:25

产品简介

数字人 PaaS 服务,基于数字人底层 AI 能力,通过云端接口,助力开发者生成数字人文件视频或创建音视频流,灵活适用各式数字人场景,如短视频创作、直播等。数字人分为两种类型,分别是图片数字人和视频数字人:

  • 图片数字人指,根据一张图片即可让其面部和口型动起来,生成数字人速度较快、成本较低。
  • 视频数字人指,根据规范采集视频后,经过 AI 训练后制作的神态、动作、表情媲美真人的数字人。

如需使用本产品创建直播并推流,请搭配 实时音视频。

产品优势

快速集成

简单调用服务端 API,即可快速实现功能,开发者无需部署运维服务端,大幅度降低开发成本,助力产品快速上线。

丰富的数字人配置

支持通过格式、分辨率、音色、形象等多维度配置接口,灵活应用于各类应用场景。

创作方式灵活

支持生成异步视频文件、实时音视频流,满足短视频或直播应用场景。

应用场景

场景 描述
短视频制作
服务端 API 接口提供数字人短视频制作所需要的包括背景、形象、音色等配置,支持不同视频格式,不同清晰度,异步生成数字人视频文件。
数字人直播
开发者调用服务端 API 创建数字人视频流任务,用文本或语音驱动数字人,以音视频实时流的形式推流至 ZEGO 实时音视频云(RTC),客户端拉流收看直播画面,实现数字人直播。
互动问答
开发者调用服务端 API 创建数字人视频流任务,开发者获取到终端用户提问内容后,用文本或语音驱动数字人回答,以音视频实时流的形式推流至 ZEGO 实时音视频云(RTC),客户端拉流获取数字人回复画面,实现数字人互动。

功能特性

主要功能 功能描述
数字人资产查询
开发者调用服务端 API 查询对应可用的公共/定制的数字人形象、音色等。
支持异步/实时的视频合成方式
支持以文件或音视频流的形式生成视频。
支持不同流媒体格式与清晰度
封装格式:MP4、WebM(支持 Alpha 透明通道)。
视频清晰度:1080P、2K。
语音合成
支持文本转语音能力,支持 SSML标记语言。
语言大模型
支持问题输入,通过语言大模型输出 AI 文案。
本篇目录
  • 免费试用
  • 提交工单
    咨询集成、功能及报价等问题
    电话咨询
    400 1006 604
    咨询客服
    微信扫码,24h在线

    联系我们

  • 文档反馈